抢滩垂类。
(资料图)
编者按:本文来自微信公众号“全天候科技”(ID:iawtmt),作者:于惠如,编辑:罗丽娟,创业邦经授权发布。
如果说通用大模型是大模型发展的初期阶段,那么垂直场景应用则可以视作其“中场战事”,在该阶段,应用与场景先行,倒逼垂直领域的大模型飞跃发展,并率先在不同产业中实现了落地价值。
由互联网和科技界掀起的大模型浪潮,迎来了新战事。
自今年3月以来,国内已有超过20家企业入局大模型赛道。从百度“文心一言”、阿里“通义千问”的发布,到360“红孩儿”、商汤“日日新”、网易“玉言”、科大讯飞“星火”、昆仑万维“天工”等的推出,再到腾讯“混元”、京东“ChatJ”、华为“盘古”等的预告。互联网巨头、科技公司纷纷秀出“肌肉”,谁也不想在这场大模型混战中掉队。
而在这场狂奔中,大模型的发展阶段已经从“通用”迈入“垂类”。
算力、大规模数据、高成本人才成为大部分企业入局通用大模型的拦路虎。但深度定制、广阔的场景应用等诉求,催生了国内垂直领域大模型的开发。
近两个月来,不少医疗、金融、教育、绘画等行业内拥有用户数据积累的中小型企业,已开始基于国内外大模型“底座”,训练适配自身的垂类模型。同时,已发布通用大模型的公司,也推出了针对特有行业的模型。
如果说通用大模型是大模型发展的初期阶段,那么垂直场景应用则可以视作其“中场战事”,在该阶段,应用与场景先行,倒逼垂直领域的大模型飞跃发展,并率先在不同产业中实现了落地价值。
路线分化短短两个月,分化已经出现。
在5月23日举办的文心大模型技术交流会上,百度智能云AI与大数据平台总经理忻舟介绍:“文心千帆大模型平台,是百度提供给客户的企业级大模型生产平台,不但提供包括文心一言在内的大模型服务及第三方大模型服务,还提供大模型开发和应用的整套工具链。”
即文心千帆可以文心一言为核心,提供大模型服务,帮助客户改造产品和生产流程;企业也可以在文心千帆上基于任何开源或闭源的大模型,开发自己的专属大模型。
多位接受全天候科技采访的业内人士认为,当前国内大模型赛道主要包括三类:一类对标GPT的通用大模型,聚焦基础层的公司;一类是在开源大模型基础之上训练垂类大模型,聚焦垂直行业的企业;另一类则是专注具体应用的纯应用公司。
“刚开始大家是一窝蜂扎进通用大模型,现在分化已经出现,不管是分化到具体行业的,还是不做研发直接调用接口做产品运营的,这个趋势是越来越清晰了。”前金山软件副总裁兼人工智能事业部负责人、现AI领域创业者李长亮告诉全天候科技。
通用大模型面临算力需求大、训练和推理成本高、数据质量不佳等挑战。一个成功的且可对外商业化输出的通用大模型大模型,要求厂商拥有全栈大模型训练与研发能力、业务场景落地经验、AI安全治理举措、以及生态开放性等核心优势。
在百度智能云副总裁朱勇看来,基础模型(通用大模型)的公司可能“只有那么几家”,但是上面会长出很多专业领域的大模型。
“训练一个基础模型,成本是非常高的,做一个千亿级的大模型,需要单机群万卡以上的算力。”朱勇说,从国内外来看,真正做通用模型的公司并没有那么多。相反,训练领域(垂类)模型所需要的代价和资源远远小于从零开始做通用模型。
因而,从商业逻辑的角度来看,大部分公司不具备做通用大模型的能力,巨头更适合做通用大模型,拥有丰富场景数据积累的公司更适合做垂域模型。
垂类大模型以深度解决行业需求为主,即企业在自己擅长的领域训练适合自己的“产业版GPT”。这类大模型生成的内容更符合特定垂类场景的需求,质量更高。
当前,已经可以看到不少垂类模型应用在金融、医疗、交易等场景中。比如,彭博社根据自身丰富的金融数据资源,基于GPT-3框架再训练,开发出了金融专属大模型BloombergGPT。
除了上述两种常见的模式,目前国内大模型创业赛道上还有一种专做应用的公司,它们没有研发团队,从现有大模型调用接口,做产品和运营。
通用 VS 垂域布局通用大模型的巨头,需要的是生态。所以百度、阿里都希望成为“大模型的底座”去赋能行业与企业。但并不是所有企业都有这样的能力。
“现有大模型的算力和能耗挑战会促使很多工作向领域专用化、轻量化的大模型方向发展,特别是金融、教育、医疗、交通等领域,大量的工作在试图降低大模型的成本。”在日前举行的第六届数字中国建设峰会上,中国科学院自动化研究所副所长曾大军表示。
相比通用大模型需要高昂的开发训练成本,基于开源模型进行垂类模型开发可兼顾开发成本和数据安全。
事实上,挑战之外,实际的场景需求也加快了大模型垂类化的过程。
“中国擅长商业模式、应用上的创新。”一位AI领域创业者说,与此同时,国内不乏AI模型的落地场景、丰富的数据,以及追风口的热情。因而,短短两个月时间,大模型领域化的发展飞速。
以百度文心千帆这个“AI大模型底座”为例,当前正在共同测试研发的企业通常来自信息化和技术普及率较高的行业,如金融行业、能源行业、泛互联网行业等。
“垂类模型是在通用大模型基础上训练的,撇开通用大模型的话,是不存在垂类模型的。”忻舟说,垂类模型强调领域的know-how,对于特定领域来说,需要针对该领域的任务做指令学习。
行业不同,场景不同,指令学习的区别也极大。比如,泛互联网行业更关注营销、推荐的效果,金融更领域更关注风控、可信、以及营销的效果。
在李长亮看来,垂类大模型与通用大模型最大的区别在于:垂类大模型在资源投入、成本投入等方面的要求下降了,但额外要求是行业known-how,即对这个行业的knowledge要求提高了。
表现在数据方面,在特定的垂直领域,企业拥有私有数据,这是别的企业花钱也买不到的核心竞争力和天然优势。
表现在算力上,通过通用大模型微调实现的垂类大模型相较通用大模型是“几何级别的下降”。
根据国金证券的测算,在模型微调阶段,由于训练量级较小,仅为万级,相关的算力成本相比之下可忽略不计。
以斯坦福大学于2023年3月发布Alpaca为例,这是一个基于LLaMA-7B基座,应用5.2万指令对模型微调训练而来的对话类语言模型。该模型基于8块A100微调,微调时长3小时,算力成本不超过300元。
当然,并不是所有企业都可以在通用大模型的基础上做微调。
以百度文心千帆为例,要在该平台上通过微调做自己的大模型需具备两个条件:企业有没有高质量的数据存下来;能否将自身业务根据对生成式AI的理解变成高质量的数据,变成指定数据做指定微调。
换言之,落地在企业端,那些有海量行业数据、懂行业know-how的企业,做成垂类模型的机会更大。
“因为有专业的数据、有行业know-how,结合不同类型的领域模型,这些领域模型将来会非常繁荣,支撑上层非常繁荣的领域应用。”朱勇说。
“两条腿”走路“GPT+行业专家系统”的模式产生了新的垂直领域大模型。
大模型最大的价值在于革新商业模式,改造商业组织的每一个环节,进而起到降本增效的效果。这也是企业纷纷入局大模型的原因所在。
而Meta旗下LLaMA模型等大模型的开源为垂类模型的发展装上了加速器。
公开信息显示,LLaMA基于通用领域的开源数据集进行训练,训练数据涵盖40种语言,包含约1.4万亿Tokens。LLaMA模型一经发布就对外完全开源,吸引了广大AI开发者。
作为完全开源的领先模型,LLaMA具备高度的灵活性、可配置性和泛化能力,可以作为垂类AI模型的通用基座。
尽管LLaMA模型参数量较小,但性能丝毫不逊色于PaLM、GPT-3等大语言模型。并且较小的参数规模显著降低了LLaMA模型的落地部署和二次开发难度。
“基于LLaMA这种开源模型,我们喂自己的数据,慢慢调试,就能调试出我想要的效果来。”一位AIGC领域的创业者告诉全天候科技。
全天候科技了解到,当下不少企业采用的是“两条腿走路”的策略,即:一边接入大模型API,一边在开源模型上炼模型,两者构成反馈链,加速各自能力的提升,打造创新闭环。
“调用API接口也是一个获取数据资源的有效手段。”李长亮说,这部分数据将来可能在企业训练模型的时候起作用。
在不少业内人士看来,对于各行各业来说,垂直大模型是一种全新的生产力,各个行业的垂直领域大模型对所在行业可能产生重大甚至是颠覆性的影响。
值得一提的是,在一级市场上,专注于垂类大模型的创业公司也是投资机构眼中的“宝藏”。
在不久前召开的2023中国投资年会上,天堂硅谷高级合伙人王伟将“垂直领域大模型,掌握行业数据、懂行业Know-how的项目”列为其重点投资布局的领域之一。
本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。
-
国内大模型迎来中场战事国内大模型迎来中场战事,抢滩垂类。
-
当前讯息:思客琦6月1日深交所首发上会 拟募资5.7亿元思客琦6月1日深交所首发上会拟募资5 7亿元---中国经济网北京5月25日讯据深交所网站今晚消息,深交所上市审
-
女子远嫁回家妈妈在包里偷塞6000多元,有零有整,当事人:特别想哭,网友:她希望你衣食无忧平安喜乐 播报5月25日,根据河南广播电视台民生频道《大象直播间》报道,5月22日陕西渭南一女子晒出视频,称远嫁回家妈妈
-
2023湖南成人高考报名时间,报名要求与条件|焦点速递2023湖南成人高考报名时间,报名要求与条件湖南成人高考网上报名时间一般为8月末-9月初报考,成考为全国统
-
下载office2003官方版_office2003官方正式版1、office2003密钥:GWH28-DGCMP-P6RC4-6J4MT-3HFDY绝对好用。本文分享完毕,希望
-
pdf文件打开是乱码怎么回事 pdf文件打开出现乱码的情况怎么办|微动态今天来聊聊关于pdf文件打开是乱码怎么回事,pdf文件打开出现乱码的情况怎么办的文章,现在就为大家来简单介
-
24 岁,年入千万,全网都在追她的四婚连续剧 环球快播网红韩安冉又又又又要结婚了。在今年6月末举办婚礼后,这个24岁的女孩即将步入她的第四次婚姻。韩安冉的婚
-
不吃肉的人,可以用鸡蛋代替吗?长期不吃肉是不可取的,对于有些人来说一天不吃肉都受不了了。所以,减肥的朋友可以隔几天吃一次肉,而不吃
-
全球快报:高铁速度一般是多少迈高铁列车的速度一般是每小时超过300公里,相当于186迈的高速行驶。高铁是一种高速公路式的铁路系统,它采用
-
北京新冠连续4周列榜首!专家:“二阳”不要带病上班!5月24日,北京市卫生健康委发布2023年第20周疫情周报。报告显示,2023年第20周全市共报告法定传染病14种255
-
江苏省泰州市市场监管部门发布《泰州市直播带货经营行为规范》近年来,直播销售行业快速发展,带动了就业创业,拓展了内需市场,推动了地方产业特色发展。为规范直播带货
-
一眼窥万年——科考人员努力破译珠峰地区古生物里的“独特密码”-全球看点41岁的中国科学院西双版纳热带植物园研究员苏涛带领4人组成的古生物科考分队,已在珠峰地区连续开展了十多
-
《原神》QQ频道专属福利活动现已开启亲爱的旅行者,《原神》3 7版本QQ频道专属福利活动以及游戏玩家激励计划现已开启~点击网页链接:https: yo
-
比手还小!勒到窒息!今年的辣妹风究竟有多离谱?_世界新要闻大家有没有发现,今年的不少新款女装的尺码都小得离谱。一家网店的试穿模特体重只有38kg,还有一家店女装最
-
焦点简讯:欧陆战争4各国公主来为大家解答以下的问题,陆战争4各国公主这个很多人还不知道,现在让我们一起来看看吧!1、索菲亚:随便打欧
-
天天观速讯丨信息港小镇创新服务中心青年文明号开放周释放青春活力信息港小镇创新服务中心青年文明号开放周释放青春活力杭州网发布时间:2023-05-2508:57为深入学习贯彻“八
-
瑞华泰:5月24日融券卖出1711股,融资融券余额8884.01万元5月24日,瑞华泰(688323)融资买入29 66万元,融资偿还92 42万元,融资净卖出62 76万元,融资余额8873 46
-
多所高校发布公务接待最新餐费标准:最高300元每人次_焦点观察近期,国内多所高校发布的《公务接待管理办法》予以明确。
-
【世界热闻】手绘动漫眼睛教程图片(手绘动漫眼睛教程)诸多的对于手绘动漫眼睛教程图片,手绘动漫眼睛教程这个问题都颇为感兴趣的,为大家梳理了下,一起
-
世界头条:合作伙伴对簿公堂,法院调解双方握手言和极目新闻记者孙婷婷通讯员何玲何秋敏实习生魏芷瑶两家长期合作企业因合同纠纷对簿公堂,日前,在武汉市江夏
-
年9月16日最新相关报道消息 12岁女孩玉米地被10人殴打 警方通报处理结果了|焦点热文今天大家应该都在关注12岁女孩玉米地被10人殴打警方通报处理结果了这件事,那么很多小伙伴在关注的同时自然
-
全球快播:小米civi没有呼吸灯吗(小米civi2有呼吸灯吗)想必现在有很多小伙伴对于小米civi2有呼吸灯吗方面的知识都比较想要了解,那么今天小好小编就为大家收集了
-
全球关注:拐卖儿童罪!亲妈收5.5万营养费送养儿子被判5年法院审理后认为,被告人徐某某发布送养子女的消息,并收取明显不属于“营养费”的巨额财产将亲生孩子出卖,
-
【全球独家】网红主播“三千哥”之死:拼酒直播为何没完没了据多家媒体消息,5月17日凌晨,某知名短视频社交平台主播“三千哥”在直播时因饮酒过量而去世。 5月21日
-
全球看点:ST泰禾退市警报拉响 上市13年终成黄粱一梦作者:孙梦凡“走向世界,创一流企业。”在ST泰禾(000732 SZ)官网上,创始人黄其森如此畅想泰禾未来。这
-
五年来,江苏承接最多新兴产业迁移企业 实时焦点企查查大数据研究院联合首都科技发展战略研究院发布《中国“抢企大战”城市地域全景报告》。报告显示,长三
-
校园安全手抄报模板二年级简单_校园安全手抄报模板_全球简讯1、一、在教室内活动应怎样注意安全? 在教室内活动,有许多看起来细微的事情值得同学们注意,否则,在
-
泰迦奥特曼剧场版:超越神秘四奥的最强奥特曼登场!十一位奥特曼合体了 全球热消息而这部剧场版中的反派角色是托雷基亚和超级怪兽格里姆德,可见黑暗奥特曼托雷基亚已经取代了曾经的贝利亚的
-
环球今热点:当前动态:今天你垃圾分类了吗?住建部:2025年基本实现垃圾分类全覆盖_每日快看 当前头条 全球速看料今天(23日),住房和城乡建设部表示,力争到今年年底前,地级及以上城市居民小区垃圾分类覆盖率达到90%以
-
苏州一商场儿童推车中英文收费不同引发质疑,商场回应:印刷错误5月22日,市民称苏州中心商场宝乐小推车收费标准不一,中文半小时20元,英文是10元,市民质疑区别对待。商