邓江:大模型助力产业创新发展
2024年服贸会专题论坛之一——“2024中国AIGC创新发展论坛”于9月13日-14日在北京举行。百川智能副总裁邓江出席并演讲。
邓江强调,百川智能是极其开放的,“我们把自己定位成芯片、新能源车里的电池,我们提供最核心的能力给大家,然后跟各个生态伙伴一起去打通产业链,实现应用生态的建立”。
以下为演讲实录:
邓江:各位朋友大家上午好,接下来由我为大家分享一下大模型如何助力产业创新发展。
“大模型”这三个字漏掉了两个很关键的字,大“语言”模型。什么叫大语言模型?其实人类过去几千年的文明知识是由人类的语言来承载的,所以这一次大模型技术革命是把人类过去几千年的知识通过数学的方式来表达。这句话听起来比较晦涩,直白一些,如果说过去每一次产业革命是把人类从繁重的体力劳动中解脱出来,那么这一次产业革命则是能够把人类从繁重的脑力劳动中解脱出来,比如每天要花大量时间写报告、写会议纪要,现在有了大模型以后,它能够帮你做这件事。
比方说我们所面对的很多供给侧问题,比如医疗,全社会都知道医疗资源的稀缺,大家挂一个号特别难,本质原因是因为由医生的脑力劳动能支撑的服务供给太有限了,因为每年毕业的医疗生特别少,导致全国一共就这么多医生,好医生更少。有了大模型以后,我们实际上能够在未来实现给每个人配置一个家庭医生。教育行业也一样,我们没有那么多金牌老师。金融业一样,我们知道全国有3000多家银行,那银行业有多少客户经理?一共有100万。中国有14亿人,但银行只有100万客户经理,所以金融行业你必须在银行存够一千万才能拥有专属的客户经理服务你。法院也一样,检察院也一样。所以可以看到我们的社会过往发展过程中受脑力劳动所稀缺的这些服务,有了大模型以后都有了更多的想象空间。
接下来给大家分享的是在大模型应用落地方面我们百川智能所做的工作。
首先介绍一下百川智能创始人王小川,相信每个人都用过他创造的产品:搜狗输入法、搜狗搜索引擎。我们的王小川总跟技术团队经常一起开会开到夜里三四点,跟技术人员一起深耕技术的决策。他曾经在很多年前提过要坚持以语言AI为中心的自然交互和知识计算。过去搜索引擎这种模式跟现在大模型有一点像,以前的搜索引擎是你问一个问题,然后搜索引擎帮你在网上找答案,但并不能确定哪个是你要的答案,所以只能根据概率给你排个序,然后访问一千个网页,然后把最有可能的放前头、最不可能的放后头,但并不能给你精准答案。所以我们还要一个网页一个网页点开,用大脑加工计算,把我想要的答案总结出来。大模型在这个模式上又往前走了一步,可以帮大家把原先大脑里需要加工计算的流程帮我们节省掉,直接把答案反馈回来。
我们也总结构建了一个最好的大模型所必须具备的技术基础和商业基础。我们看到大模型现在非常热,大家也非常兴奋,但实际上这个技术出来也就短短一年多不到两年时间,如果按照我们过往经验,每一次产业革命带来的变革都要持续至少五十年甚至一百年的时间。我们现在在喊新能源汽车,但电一百年以前就已经发明了,一百年以前就有人已经做出电动车模型了,为什么中国现在新能源汽车渗透率只有50%,欧美可能连20%都没有?是因为电在汽车这个工业里的深度变革创新就是需要一百年的时间,现在各方面技术才成熟。
所以大模型技术也是一个非常长期的事。我们的创始人在过去二三十年有丰富的商业成功经验,包括对商业的敏感性。另外我们也配备了非常专业的、行业资深的专家始终在里面做钻研深耕。刚才主持人也说了,我们刚刚完成了50亿的融资,可能是唯一一家被北京、上海、深圳几个区域国资同时投资的一家公司,这可能关系到未来中国在中美科技竞争中的命运问题。包括我们始终在医疗和金融领域做持续的战略投入。为什么做这个?我们看到医疗和金融应该是知识密集最顶尖的行业,培养一个医生的时间非常长,当然你培养一个金融专家时间也非常非常长,跟普通的送外卖不一样,送外卖可以随时去送外卖,但不能随时到银行当客户经理,随时到医院当一个护士。因为要学习大量知识才能胜任这份工作。我们始终坚持自主创新,做中国最好的基座模型。当然这个技术刚刚被人类发现、发明不到两年时间,所以需要做大量技术攻关的工作,我们也跟国内国外最顶尖的高校,包括科研院校建立了非常紧密的合作关系,去做很多技术的研发、更新、迭代的工作。
最后更重要的是,我们要保持一个非常开放的生态,所以我们的模型不走开源路线,但百川智能是极其开放的,我们把自己定位成芯片、新能源车里的电池,我们提供最核心的能力给大家,然后跟各个生态伙伴一起去打通产业链,实现应用生态的建立。
百川智能是去年4月刚刚成立的一家公司,我们用短短一年时间连续发布了十几款模型,其中5月份新发布的Baichuan4是国内首个能够在综合能力方面对标GPT-4的中国基座模型。我们也发布了APP百小应,欢迎大家下载试用,我们叫“最懂搜索的AI APP”,所以我现在很少用搜索引擎了,我直接在百小应就好了,它会帮我搜、帮我总结结果。
另外还有一个需要关注的重点事项,大模型技术还远远没有到稳定的阶段,技术迭代非常快。网上经常有新闻说今天某个公司出了一个新的模型,明天某个公司又出了一个新的模型。对于产业应用来说又一个很重要的问题,技术不稳定,产业需求很旺盛,怎么解决平衡点的问题。我们的客户经常会问这个问题,今天用百川智能的模型,明天别人出更好的,怎么办?有一点需要格外注意,在选择大模型的时候,一定要选择那家有持续创新能力的厂商。百川智能融这么多钱,不是因为我们现在缺钱,是因为我们知道美国在不断创新,当美国出GPT-5的时候我们必须要快速跟上,我们需要有大量的现金储备来保证我的研发投入,跟美国在这次技术竞争中始终保持在第一梯队。
百川智能在医疗和金融领域也取得了突破性成果,我们的大模型通过美国和中国的医师职业资格考试,而且是很高的分数,证明我们的大模型在医疗知识能力上已经具备了一个医疗毕业生甚至一个医生的水平。另外在金融领域,我们在国内公开评测榜上保持第一梯队,这个评测是非常复杂的,也就是说我们对金融知识的理解也达到了人类的水平。特别是在金融场景,我们已经在很多金融机构有很现实的应用落地,来提供脑力的供给。所以我跟一个金融机构的行长聊过,他不太懂技术,就问我大模型到底能干什么。我说我给你举个例子,假设我能够以月薪一千的成本无限给你供给大学生,你觉得对你有没有价值?他说非常有价值。我说无限供给的大学生能做什么,你能不能想象?他说能想象干很多事。把大模型理解成无限供给的脑力劳动者,你想想到底能干什么,这个就带来我们最大的一个价值。
现在大模型行业不缺模型,美国可能就几款模型,中国能达到千模、百模,但现在要做的是怎么把场景和大模型的数据、算力、算法结合起来,这个结合是一个相乘的关系,不是一个相加的关系,任何一个场景乘上这套逻辑以后都会有大量的商业价值产生,所以这里面离不开对每个行业、业务需求、资源匹配包括风险管控等等一系列的理解。所以大家看到大模型这么热,但实际应用感觉没什么生意,主要因为这是一个复杂的落地过程,比如电在汽车行业应用一样,用了一百年时间探索才跑通,要解决各种各样的问题。现在我们也在做这件事,致力于帮助我们的合作伙伴和行业去解决最终的落地问题。
现在的技术栈和过往的IT技术栈有本质区别,对整个技术架构有深刻的影响。眼下是AI+,就是AI+某个领域、某个场景,未来推动+AI,各个场景把AI加进去,真的能够把大模型所谓的数字员工融入到整个企业业务流程中去创造价值。过程中除了做能力建设以外,具备了人类所有知识,但为什么还是无法完全替代人?这是因为还有EQ能力,除了大模型准确理解人类、准确的提供专业的服务以外,我们还要有个性化能力、情感互动的恰当性等等能力,美国的OpenAI也在做这方面,最近发布的几款模型,4o能够帮助大模型顺畅地跟人交流,能够说话、对话。现在又发了一个新的模型,我们叫慢思考,在面对复杂问题时需要更多时间去思考答案,而不是0.1秒吐答案在那儿胡说八道。慢思考也是人类很重要的能力,您问我问题我也得想想,大模型有没有慢思考的能力,包括在某些领域强挖掘的能力,这都是作为大模型公司要解决的问题,最终打造IQ和EQ双商在线的一个能力。
大模型在各行各业怎么落地?在金融行业刚才有提到营销,包括客服、数据分析、风控等等领域我们都做了大量的尝试,在这些落地场景下并不能做出一个风控专家。我看到昨天、前天服贸会上有很多领导讲要造专家,但实际上应该反过来说我们说不是造专家,我们就是要造中专生、大专生,无限供给大专生,把人从简单劳动当中解放出来。以前讲,说机器人把所有事都干了,但眼下实际落地的是扫地机器人,就只能扫地,帮你把地给扫了,然后有刷碗机器人,帮你把碗给刷了,未来一定会出现全能的家务机器人,把家务全部给干了。现在大模型也是一样的,作为脑力供给,我们提供的是基础的脑力,比如我就提供大专生,他帮你写报告、帮你去搜资料,帮你做简单的数据分析,帮你做简单的营销。未来,随着它水平不断提高,我们相信开始能够开始取代那些复杂的脑力劳动,比如投研,投研不是要做高端投研,比如帮高净值客户做投研支持,而是我作为一个小散户也需要投研支持,虽然账户中就几万块钱,但我也特别希望有券商来告诉我到底哪些赛道、哪些行业更有价值。为什么券商不去供给这种投研服务给普通散户呢?投研成本太过,供不起。所以我们现在跟券商合作中最基础的投研服务,通过大模型完全可以做到,包括蚂蚁公司核保理赔的工作,原来都需要专家在里面,比如提供的医疗报销单据,需要懂医疗的人来审核,但是我们现在医疗大模型的应用完全就可以省了这道步骤。
在医疗领域大模型的应用就更加令人兴奋,北京的居民比较幸福,能够获得优质的医疗资源。但其他城市做不到,医疗资源有限,水平也极其有限,所以在医疗领域大模型并不是取代三甲医院的主任主治,是真的希望给县乡基层供给更优秀的医疗资源。比如我们现在跟北京儿童医院做儿科的重症筛查,为什么做这件事?是因为我们看到有大量的基层孩子被误诊、耽误,病到很严重的程度送到北京儿童医院。我们站在北京儿童医院视角,希望给基层提供筛查能力,在孩子一开始出现症状的时候能不能有一个AI医生在前端先去筛查这个孩子不是感冒,其实是白血病,能不能去做这件事?这件事的筛查能力不是一般的基层医生能够搞定的,这个就需要我们要给基层去供给重症筛查能力。包括现在在健康领域,比如很多合作伙伴销售医疗器材的,他在跟客户对话营销过程中是需要掌握医疗知识的,比如助听器,我的耳朵听不清到底什么原因,是因为年纪大了还是因为疾病或者还是什么原因,这些交流过程中,没有办法无限地供给具备医疗知识的客服,也不可能要求所有客服都是医学院毕业的。我们现在可以提供专项的健康管理专家,给到这些健康相关的企业,使客服具备医疗专业能力,涉及医疗的问题就交给我的AI医生去回答就可以了。这个落地场景会比医疗更简单,因为医疗是一个严肃场景,说错了有很多风险,健康咨询相对来说只是咨询,要求更低一点,这里面有大量案例在实际落地了,目前也服务了非常多的客户。
包括体检场景,你体检完了有一个体检报告,发现有几个指标高的,你的第一件事去某搜索引擎搜一下看看严重不严重,发现挺严重的,赶快到医院挂号。但说得模棱两可的时候,你心里就很嘀咕:这到底严不严重啊?到底需不需要去医院?可能到明年大家体检的时候就会看到,你的每一个指标后面异常都会有一个二维码,这个二维码是一个专科的AI医生帮你解答这个指标的问题,甚至给你很多健康管理的建议,说你这个指标高了,你应该每个月去复查一下。包括平常饮食、起居、运动等等,应该注意什么。一个月以后还可以再去问他,让AI医生跟踪你的数据,指导你去控制这个指标,这是大模型在健康领域给健康体检机构供给专科医疗咨询能力的逻辑。
在教育领域也是一样的,我相信很多在座的嘉宾都面临过这个问题,孩子在学校听完课回家写作业,碰到不懂的家长就开始辅导,辅导以后也不知道是否听懂,歇斯底里地问到底听没听懂,孩子说听懂了,实际上啥也不懂。现在我们对家长要求太高了,老师只负责传道,家长要负责授业解惑。但老师为什么不做这个事?是因为老师太有限了,老师一个人面对几百个学生,老师没有办法针对性因材施教。所以百川智能现在跟很多教育领域的合作伙伴一起造AI老师,今年辅导小学,明年辅导中学,一道题做错了,先由AI老师讲一遍,问孩子几个问题让回答,然后判断孩子是否真懂,之后再出三道题,如果都做对,才证明孩子真的懂了。另外我们还做了很多很多互动场景,在历史教育方面,中国历史现在的教育是按长线,先把中国史讲一遍,然后把世界史讲一遍。比如讲唐朝的时候可以延展开,说这个时代李白在干什么、杜甫在干什么,然后罗马在发生什么事、埃及在发生什么事,可以这样横向贯通的。但这种贯通是基于对兴趣的引导,其实可以用AI老师基于你的兴趣来帮你去展开整个知识的讲解。我们跟很多博物馆也在做这件事情,会给大家带来巨大的想象空间。当然这个过程中,我们也把AI医生加进去,及时评估孩子的心理状态、评估他的心理健康,有没有波动甚至抑郁的情况,心理预警、教辅都结合在这里面。传统模式下都是要求老师去做的,但优质教师资源太稀缺了。我们原来想获得这样的全流程方案,只有一个办法,就是请来一对一的家教,现在有了大模型以后,能够很快地为每个孩子配置一个因材施教的老师,不断针对他的学习文化给予他辅导。
政务也一样,政府现在服务压力非常大,不管是出于成本还是大家越来越高的要求,我们能够帮助政府去提供基于脑力的服务供给。比如检察官,一个城市,像北京这种城市有几千个检察官,每天非常忙,加班到深夜,他们在做什么?我们想象的检察官是处理大案要案,其实不是,他们是在处理极小的案子。为什么会出现这种情况?就是因为检察官是一个法律密集型行业,供给不足,但案子无限,所以没完没了重复某一件事。比如酒驾,通过跟检察院交流我发现酒驾其实特别简单,通过公安卷宗判断几件事:第一,是不是自首;第二,有没有撞到人;第三,有没有坦白从宽;第四,酒精含量有多少。大概这各方面就可以把这几件事判清楚了,基本上判断时间够确定了。但是卷宗的描述是很随机的,比如在路口把肇事者抓住了,问他喝了多少酒,他说喝了一瓶啤酒,经过调查发现他其实喝了一瓶白酒,这就不是坦白从宽了,而是一开始就说谎了,检察官就在判断这些事。但我们做测试会发现,大模型对这些事处理特别轻松,你把整个卷宗传上去,他马上把答案都告诉你,包括答案的依据都告诉你了,所以这些对大模型来说是特别简单的。未来我们希望无限的供给这种数字检察官,检察官最终要做的是看一下结果,签字。
大家看政务服务大厅,已经有机器人能够提供专业的服务了。所以未来的政务服务前台,真的一个机器人就足够了,可以24小时情绪稳定地服务你。未来政府服务大厅不再是冰冷的机器,而是穿着制服的机器人,现在就可以做到,只是机器人成本还偏高。未来量产以后,我相信它的成本降到10万以下没有任何问题,比雇佣一个人要便宜很多,但它掌握的知识却非常丰富,可以非常顺畅地去跟人交流,帮民众办业务,提供咨询服务。
这些就是我今天要分享的内容,谢谢大家。
新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。