您所在的位置:首页 >行业 >
国产大模型的100种可能

时间:2023-04-23 20:23:28    来源:钛媒体APP

图片来源@视觉中国


(相关资料图)

文 | 明晰野望

4月以来,市场几乎每天都有各种国产大模型的新信息,一众科技大厂、创业公司陆续公布相关进展,加速入场。

争相涌现的国产大模型,特别是科技大厂基于投入、算力、大数据等方面的优势,为中国自主大模型的发展带来了广泛的可能性。

事实上,BTA、华为等大厂在该领域早有研发,并非新入局者。之所以在ChatGPT“教育全社会”前“隐而不发”,一是各家的核心业务不同,AI研发的侧重点也有所不同。二是正如阿里云周靖人所言,在ChatGPT出现前讲“预训练大模型”,没有人会感兴趣。

当下,有人在琢磨如何快速推出自己的国产大模型抢占市场,也有人在以算力为代表的底层基础设施层发力。更有人直言,相比于“神仙打架”,更关心国产大模型怎么落地应用,看看这个先进生产力工具究竟如何改变产业与生活方式,以及能否实现超越,由追随到引领?

关于“与OpenAI差距”的讨论也从未停止,如李彦宏的“2、3个月”,王小川的“不会低于两年”,时间定义虽不同,但均表明了其并没有领先到难以追赶的程度。

大戏,才刚刚启幕。

01 “iPhone时刻”与增量市场

“超越”不是伪命题,在中美科技竞争、市场隔离的背景下,中国科技产业需要自己的“iPhone时刻”。

人工智能则是最有希望诞生这一时刻的领域:在过去十余年间,AI进步由中美主导,投入也最巨大,因此机会主要也在中美之间。

Open AI的成功,无疑强化了这一观点,并给所有中国科技企业带来了一剂强心针,照着这个路径去做生成式AI,是能够走通的——这样即能保证“革命性技术”诞生时离其最近,也能率先进入“增量”市场。

这是在科技行业低迷的当下,一个难得的增量空间。如果能取得先发优势,就有可能开辟巨大的新市场,或给已有业务,如云计算、电商、游戏、社交、搜索乃至B端的千行百业加上“放大器”。

大模型不仅是聊天软件,更是生产力工具,已是共识。

在阿里云峰会上,张勇称所有产品未来都将接入通义千问大模型,进行全面改造;刘炽平在腾讯财报会上强调,生成式AI可成为已有业务的 “倍增器”,也可帮助开拓新增长线;任正非更是认为,ChatGPT 把计算、管道流量撑大,华为产品就有了机会。

其中的逻辑是,AI是数字化时代的“操作系统”,就像移动互联网时代的IOS和安卓,加速促进了产业数字化的发展,对生产、生活方式进行下一次重塑,带来更大空间的新领域,而大模型是整个AI产业链中,核心中的核心。

从长远看,如果不能取得先机,未来就有可能会影响现有的整个商业模式,甚至被颠覆。

如周鸿祎在4月21日发出内部信,要求360全员拥抱人工智能,称“已领先一个身位”。近期接受采访时也表示,国内“搜索引擎百度市占率60%,公司30%”,强调“在战略上对标微软,搜索上践行必应”,改写格局的企图心强烈。

百度反应更为激进,做出了全球第一个对标ChatGPT的文心一言。另据晚点财经报道,在文心一言内测前,李彦宏每晚和项目团队开会,他们为筹备产品甚至一度睡在公司。

中信建投的一份“会议纪要”也显示,过去几个月他们调研了很多一线互联网公司,得到一个非常一致的结论:这次是全面的一把手工程,不管是BAT还是字节、华为,均是创始人亲自督战,对大模型团队全力支持。上一次出现如此情景,还是2009年移动互联网来临的时候。

中信建投因此认为:未来6-12个月的AI行业会很卷,但也很精彩,各家模型的登场才刚刚开始。

但仅是“开始”,当下国内大模型超过万亿参数的,就有阿里的M6、腾讯的混元、智源研究院的悟道2.0,华为的盘古Σ,千亿以上的也有近十个。

从发布时间看,百度、阿里、腾讯、华为等一线科技大厂,在ChatGPT热潮前均已推出过大模型。

百度的ERNIE 1.0于2019年推出,即后来的文心大模型,目前更新到 3.0 版本;阿里在2021年发布语言大模型 AliceMind和多模态大模型 M6,去年9月合并为通义大模型。

腾讯在2022年6月发布混元大模型,目前更新至 2.0 版本。微信去年 10 月也发布了大模型 WeML;华为盘古大模型于2021年4月发布,后续发布了NLP、CV、多模态等多个大模型。

这些都说明,中国科技企业有技术和能力推动一场大模型的变局,当然,差距和阻力也依然客观存在。

02 国产大模型需要“新想法”

李彦宏在文心一言发布后曾说,百度有信心在综合能力上,迅速追上甚至超过 ChatGPT。

这可能不是百度盲目自信,今天的大模型就像一场刚刚开跑的马拉松,“你追我赶”是必然阶段。 现在Open AI领跑,也许明天谷歌就会赶上来,但也有可能是阿里、腾讯、华为实现弯道超车。

科技行业不同于其他行业的魅力所在之处在于,每一轮科技创新都是由大的确定性和小的不确定性构成,带有偶然性,并不是简单的强因果关系。

但略显遗憾的是,目前多数中国科技公司在做的大模型,包括百度和阿里在算法方面和GPT-3架构基本类似,都是基于谷歌的Transformer,其他方面也是追随OpenAI的脚步实践,在迭代速度不如人的情况下,反而差距越拉越大。

李彦宏曾明言,百度“文心一言”在研发阶段时曾与ChatGPT进行对比测试,当时差距是一个月能追得上。可过了一个月再次测试后,发现差距反而拉大了。

阿里云周靖人也坦承,目前通义千问与ChatGPT仍有差距,“GPT还是属于各方面都领先的地位”。

更为关键的是,ChatGPT“暴力美学”式大模型路径可能走到了尽头。

近日OpenAI首席执行官山姆·奥特曼公开表示,“大语言模型规模已接近极限”,“我认为我们正处于巨型模型时代的末尾,目前尚不清楚未来的进步究竟来自何处”。他同时否认了GPT-5的存在,“而且一段时间内也不会有”。

自ChatGPT推出以来,竞争对手众多。

如马斯克已经确认自建 AI 聊天机器人TruthGPT与之硬杠,亚马逊也大力投资生成式AI,谷歌大脑合并DeepMind联手追赶等等,还有大批初创公司正在构建更大算法。此外,欧洲各国正在禁用或拟禁用ChatGPT。

因此尚不清楚山姆·奥特曼出于何种考量做此表态,但也不排除巨型AI模型时代可能正在结束。这意味着大模型进化的“下一步”需要再次“另辟蹊径”,尤其是国产大模型更需要有“新想法”。

目前生成式AI的应用在文本领域相对成熟,从海外已落地或处于 Demo阶段的应用案例来看,在代码、图片、视频、游戏等领域,海外均有所创新。

但中国显然有更广阔的市场及更丰富的应用场景,这也是中国科技公司天然的本土优势:从toC走向toB。

有很多科技公司的从业人士认为,中国的大模型之路应该与美国市场不同。他们更认可一种“两条腿走路”的方式,即一边做大模型基础平台开发,一边直接瞄准垂直的行业场景落地,实现大模型与场景化的两翼齐飞。

这样既能持续获得更多更丰富的各个行业里“好的原材料”(数据),也使更多的研发人员有机会深入到一线,用大模型去解决实际问题(应用场景),从而在工程化、产品化、场景化上不断迭代,最终与技术底座形成飞轮效应,走向商业化的正循环。

如华为盘古大模型强调在矿山、电力等场景的应用,腾讯CV(计算机视觉)大模型在工业质检、医疗影像等领域的落地,及诸多AI创业公司深耕垂直行业,都是出于此等考量。

从中长期来看,AI大模型也一定会加速渗透到更多toB的场景,比如汽车、工业(制造业)、航天航空卫星、能源、生物制药等领域,这也是中国数字化发展的主线。

03 “AI+一切”之数字经济

2018年时,华为有个“达芬奇”计划,旨在将AI添加到一切产品和服务中,也可以理解为“AI+一切”。其中最首要的一步,就是开发AI芯片,挑战英伟达。

那一年,从产业革命,技术创新的周期视角下来看,应该是数字化和智能化的开端,数据、算力、算法都迎来大爆发,更是新一轮硬件终端智能化趋势的起点,比如汽车、穿戴设备、智能家居等等物联网终端,至今全球已经有接近1000亿的Iot智能终端实时在线。

但是,并没有数字化时代现象级的应用诞生,不管是自动驾驶还是VR、AR、智能家居、工业互联网乃至元宇宙,过去几年落地都不及预期。

中国也没有诞生自己的英伟达,美国却又增加了OpenAI这个AI新标杆。这说明,科技领域永远没有属于追随者的时代。

而大模型之所以形成全球共振效应,因为它可能是全面加速数字化应用落地的超级工具,这是一个全新的节点:大模型更多是一个工程上的突破而非技术突破,一旦商业模式确认,各行各业的落地速度会比过往快很多,这也是越来越多的企业急速涌入的根本性原因。

所以在全新节点下,4月18日钉钉全面接入“通义千问”,这意味着阿里大模型正式面向B端客户。此前在阿里云峰会上,张勇曾强调,“面对AI时代,所有产品都值得用大模型重做一次”。

“AI+一切”的野望始终都在,这为国产大模型的未来带来了何止100种的可能性。而钉钉最想实现的一个可能“是成为超级APP”,钉钉总裁叶军如此说。

但在理论上,百度、阿里、腾讯、华为、字节凭借各自的历史积累,都有可能成为“AI+一切”的赢家,而不是先做的就一定比后做的好。

目前从不同渠道流出的消息显示,4月份华为会发布自己的模型,8月份腾讯大模型要出来;字节版的ChatGPT已在内测,但内测之后体验效果不好预计在9月上线。

不过决定最终谁能跑出来,一定是先“卷”一轮。

从中国经济发展的历史来看,无论是家电、新能源车还是电商、短视频直播行业,“内战必先于外战”,但“外战优于内战”。

大模型之战应该也遵循这个路径,很多小模型或者小场景的商业闭环会被大模型“吃”掉。而大模型一旦成功,会是万亿市值规模的巨大空间,当然最后跑出来的也可能是两、三个大模型。

届时,不但会产生中国的“OpenAI”,中国的“英伟达”也会有,底层框架更会有。

因为中国大模型只有构建在国产技术底座上,每一层都实现自主可控,才有可能纵深地做持续闭环优化,这就跟芯片及再上层的芯片先进制程都要实现“自主”是一个道理。

那时国产大模型实现超越,切实可期。

但AI从来不只是技术、算力、人才的角逐,更是国家战略的角力。4月份以来,网信办发布了《生成式人工智能服务管理办法(征求意见稿)》,科技部发起成立“国家超算互联网联合体”,及从去年到现在出台的一系列有关数字经济、数据要素相关政策,都表明了国家的关切与肯定。

也就是说,相对海外对大模型发展的矛盾态度,中国对整个数字经济及人工智能的发展,是持一贯的支持态度,这为中国大模型的未来,加上了一个至关重要的确定性。

责任编辑:

标签:
国产大模型的100种可能

国产大模型的100种可能

在阿里云峰会上,张勇称所有产品未来都将接入通义千问大模型,进行全面改造;刘炽平在腾讯财报会上强调,生

苏州通转转卡怎么用划算|当前快播

苏州通转转卡怎么用划算|当前快播

苏州通转转卡怎么用划算如果您持有的是24小时优享卡,推荐您:1、苏州博物馆(免费)→拙政园(10:00进园,开始

今日天秤女喜欢一个人的阶段_天秤女爱上你三个阶段 全球今头条

今日天秤女喜欢一个人的阶段_天秤女爱上你三个阶段 全球今头条

1、第一阶段:如果她喜欢你,但不是很喜欢的那种,那么她表面上不会把你当回事。2、即使你邀请了她,也不一

今日热文:大众夏朗怎么样啊_大众夏朗怎么样

今日热文:大众夏朗怎么样啊_大众夏朗怎么样

很多人认为大众是大众化、大众化的车。顾名思义,就是大众买得起的车。但是,有一种大众,他不是大众,可能

每日速看!汇通集团: 汇通集团关于召开2022年度业绩暨现金分红说明会的公告

每日速看!汇通集团: 汇通集团关于召开2022年度业绩暨现金分红说明会的公告

汇通集团:汇通集团关于召开2022年度业绩暨现金分红说明会的公告

天天信息:上海谊众:注射用紫杉醇聚合物胶束列入中国临床肿瘤学会非小细胞肺癌诊疗指南(2023)

天天信息:上海谊众:注射用紫杉醇聚合物胶束列入中国临床肿瘤学会非小细胞肺癌诊疗指南(2023)

上海谊众:注射用紫杉醇聚合物胶束列入中国临床肿瘤学会非小细胞肺癌诊疗指南(2023):上海谊众公告,公司

智高保湿滋润面霜_对于智高保湿滋润面霜简单介绍_环球新动态

智高保湿滋润面霜_对于智高保湿滋润面霜简单介绍_环球新动态

1、智高保湿滋润面霜是由阿撒娜股份公司生产的一款化妆品。2、于2020年12月1日备案。文章到此就分享结束,

【环球新要闻】简历里面特长爱好怎么写_简历上特长爱好怎么写 简历上个人特长怎么写

【环球新要闻】简历里面特长爱好怎么写_简历上特长爱好怎么写 简历上个人特长怎么写

1、很多刚大学毕业的小伙伴肯定在写自己的简历啦,那么简历表中的个人特长该怎么写?首先,要注重两个关键

网传安徽滁州高职院校分类考试存在作弊,官方:查监控未发现

网传安徽滁州高职院校分类考试存在作弊,官方:查监控未发现

据@美好滁州通报:4月22日17时许,发现网传我市22日上午高职院校分类考试中存在作弊等问题。滁州市教育招生

世界观速讯丨菱角长在什么地方(菱角长在什么地方视频)

世界观速讯丨菱角长在什么地方(菱角长在什么地方视频)

菱角生长在淡水里,它们是长在水面上的漂浮植物,几乎全国各地的河流、湖泊,甚至是小池塘都有。

洞察管理的关键:领导力的3个层级

洞察管理的关键:领导力的3个层级

加(微信:New-leaders)进入《领导者管理笔记》读者群►领导者说:★思路决定出路,方法决定结果,实现结

世界最资讯丨2023珠海圆明新园五一烟花秀表演几点开始

世界最资讯丨2023珠海圆明新园五一烟花秀表演几点开始

2023珠海圆明新园五一烟花秀表演几点开始?晚上9点圆明新园2023五一“古风市集奇妙夜”——湖面音乐烟花...

低压电工作业是指对()V以下的电气设备进行安装、调试 低压电工作业 天天最新

低压电工作业是指对()V以下的电气设备进行安装、调试 低压电工作业 天天最新

今天来聊聊关于低压电工作业是指对()V以下的电气设备进行安装、调试,低压电工作业的文章,现在就为大家来

世界动态:缺钙_关于缺钙的介绍

世界动态:缺钙_关于缺钙的介绍

1、正常人的血钙维持在2 18-2 63毫摩尔 升(9-11毫克 分升)。2、如果低于这个范围。3、则认定为缺钙。本文到

苹果急了,开始“抄”余额宝的作业

苹果急了,开始“抄”余额宝的作业

都说“科技企业的尽头是金融”,没想到苹果也走到了这一天。2023年4月17日,苹果公司宣布联合高盛银行推...

当前速递!全国这么多新增存款,有哪3个来源?明白之后,存钱目标清晰了

当前速递!全国这么多新增存款,有哪3个来源?明白之后,存钱目标清晰了

全国这么多新增存款,有哪3个来源?明白之后,存钱目标清晰了,存款,小银行,国有银行,收入证明

女孩虐男孩变态作文怎么写_女孩虐男孩变态作文

女孩虐男孩变态作文怎么写_女孩虐男孩变态作文

1、[作文女生赖皮]  今天中午我们男生和女生一起在操场上玩温老师发明的游戏,游戏规则是这样的:女生站

广汽传祺影豹R将于4月27日上市 搭载2.0T+8AT 或售14-16万 焦点播报

广汽传祺影豹R将于4月27日上市 搭载2.0T+8AT 或售14-16万 焦点播报

日前,我们从官方渠道获悉,广汽传祺影豹(图片|配置|询价)R将于4月27日正式上市,新车将搭载2 0T发动机,匹

关于中古汉语日母字的声母r 当前热闻

关于中古汉语日母字的声母r 当前热闻

敦煌文书pelliottibetain1262中,日母字“若”、“人”,禪母字“是”、“视”,都含有声母ʒ,“若”、...

视频会议需要哪些设备配置_视频会议需要哪些设备

视频会议需要哪些设备配置_视频会议需要哪些设备

1、完全没有问题。2、只需要加上小鱼NE60桌面终端,或者ME90 ME40 ME20放在会议室内,这个的选择依会议室大

这种小晶体,曾杀死世界首富

这种小晶体,曾杀死世界首富

这种小晶体,曾杀死世界首富

成都女子喝中药一周发现成分是蟑螂:之前觉得挺好喝,现在有些膈应,但还会继续喝|环球速递

成都女子喝中药一周发现成分是蟑螂:之前觉得挺好喝,现在有些膈应,但还会继续喝|环球速递

4月22日,据白鹿视频报道,4月21日,四川成都一女子喝中药一周后,才发现药唯一的成分是蟑螂,引起广泛关注

他怒批:拜登总统太离谱!

他怒批:拜登总统太离谱!

美国福克斯新闻频道主播塔克·卡尔森在4月20日播出的节目中称,美国不仅继续维持乌克兰生物实验室运转,...

每日时讯!古人对自己的谦称有哪些_古人称谓之谦称

每日时讯!古人对自己的谦称有哪些_古人称谓之谦称

今天小编肥嘟来为大家解答以上的问题。古人对自己的谦称有哪些,古人称谓之谦称相信很多小伙伴还不知道,现

世界即时看!常友科技信披与供应商不一,印尼巴沙木计提超千万,收现比低位

世界即时看!常友科技信披与供应商不一,印尼巴沙木计提超千万,收现比低位

来源权衡财经文研究员朱莉编许辉4月12日,中国有“人造太阳”之称的全超导托卡马克核聚变实验装置(EAST...

广告

X 关闭

广告

X 关闭