人类大事记:ChatGPT中国科技巨头的叹息之墙

凌镜财经 作者:叶加文 2023-02-17 19:20
[凌镜导读]

人类大事记:ChatGPT中国科技巨头的叹息之墙

周鸿祎和张朝阳在搜狐自制的对谈节目中说道,国内最有可能达到ChatGPT高度的是搜索引擎类的公司,因为他们已经通过自身的网页爬虫和基础算法拥有了一部分数据基础。但这相比开源的全球互联网数据量,特别是中文网络以外的数据量而言显然是不足的,而这洽洽是OpenAI的强势基础之一。也许对于360搜索引擎而言,处在国内网络监管环境中,说出的这番话才是他在这个风口当下的心声。

自去年2022年11月30日ChatGPT发布至今,在微软连续加仓OpenAI的情形下,已拥有过千万用户的ChatGPT估值跨越了200亿美元。而其发布当日,中国内地舆论正处在11月份监管层密集释放地产政策红利“三支箭”的喜悦和兴奋中。上周美国劳工部发布的2023年1月就业数据为51.7万人,远超市场预期,失业率降至3.4%低位。微软CEO纳德拉表示,由人工智能助力的搜索引擎将成为公司在其9年任期内最大的事情。继续推动自身搜索引擎Bing与ChatGPT融合的宣传伴随着市场数据的向好,使微软市值一夜之间再次飙升800亿美元。面对微软的强势,Google周三紧急召开Bard发布会,试图在AI聊天机器人领域扳回一城,不料Bard在“韦伯深空探测望远镜有哪些新发现”的回答中错漏频出,把韦伯和哈勃望远镜在NASA的发现成就之间分辨得很吃力。

在2月7号的本轮行情中热门中概股涨幅居前,纳指中国金龙指数涨2.35%。知乎涨31.69%,百度涨12.18%,贝壳涨4.93%,阿里巴巴、拼多多、京东录得小幅收涨。百度则宣布推出“文心一言Ernie Bot”英文名字翻译起来酷似摇摇乐,称将于3月份完成内测向公众开放。随后腾讯通过外媒披露正在加速加大投入内容自主生成工具。阿里巴巴也向媒体证实其“达摩院”正在研发对话AI,将大语言模型与“钉钉”结合。10号京东宣布“言犀”的开发路线图,含有五个应用两个领域一个平台,作为产业端App将应用AI整合产业实践和技术积累,并正式命名为:ChatJD.

深究ChatGPT的核心构成即是通过大语言模型(Natural Language Processing)分析大数据并做出应答,属于AIGC(AI生成内容)的一种模型程序,利用“深度神经网络”(Deep Neural Networks)技术,从全球开源互联网数据中学习。有分析指出,ChatGPT已经可以产生至少30种以上的用户定向的指令和功能,包括:内容概括、PenAI代码生成、时间复杂度计算、语法纠正、语言翻译、情绪评分、Python解释、程序命令、SQL语句、命名产品、调用联络方式、程序语言转换、颜色配置、美食配方、好友管理、提取关键词、制作结构、StripeApi、信息分类、广告制作、代码修复、表情符号、段落写作、正态压缩、主动生成敷衍聊天、人称代称转换、评价与点评、故事内容创作、模拟头脑风暴、处理面试、代码互换翻译、AI间学习、处理表格、情绪检测、步骤分解、知识学习等等。这许多强大功能的集中,产生了一种AI概念平庸和沉寂乏味了多年后的智慧涌现的势头,让全球用户乐此不疲。在许多学术机构和知识产权机构宣布了对ChatGPT的限制措施后,几天前的2023年情人节,数以万计的情侣收到了对方由AI代笔的抒情小作文。

看到令人惊异的产品表现后,面临3月份发布窗口的百度仍然三缄其口。在AI产品现有的呈现上,ChatGPT给出了远超国内大模型的实力表现,几乎一夜之间的评价被分割成两种截然不同的形态:追悔惊惧寝食难安,案例可抄盲目乐观。但从OpenAI公布的ChatGPT的前身InstructGPT的论文中我们还是能够看到其核心算法的函数系统设计既不担心芯片基站的算力支持,也不担心所谓“AI觉醒”导致的洪水滔天,显示出笼统而又精巧的概括性。它的RL学习策略(Reinforcement learning)通过新置入SFT监督训练模型并引入更前身的GPT3的训练分布(Dpretrain),使每一次“x”更新时“y”也得到更新,令附加在其中的原始预训练数据不断得到新的深度训练反馈,从而使惯常使用的爬虫模型所带来的“数据杂讯”得到过滤。

深度学习在之前被一些逻辑分析判断为分割存储的不断加深过程,加上不断地建立指令性调度形成的自我反馈,突破算力浪费的通途将是量子计算方式。现在看来,传统实用的方式被“充分训练的过程”证明依然有可以挖掘的深度。

最后是关于AI觉醒洪水滔天的担忧。早年间马斯克曾经站在AI一众拥趸包括扎克伯格和拉里佩奇的对立面上,经受他们指责自己有关AI导致人类毁灭的论调是“不负责任的”。直到今天大家发现OpenAI这个有限合伙企业的分红条款上写明:第一阶段优先保证马斯克为首的第一批投资人收回资本,然后才轮到微软。我们才明白马斯克为什么说小扎克“懂的有限”。站在对觉醒担忧的历史关口,建立SFT模型的人必须保有中年人的传统警觉,有人形象的比喻道:相比起来扎克伯格只是一个心地善良天资聪颖的小孩,佩奇和那个布林是两个痴迷技术的少年,乔布斯是一个作女文艺范儿却又作风极端的青年。只马斯克是一个成熟稳重的中年人。大家都在玩儿,他在提防着远处的狼群和飓风——不知这种过誉钢铁侠本人能否承受。

野径云俱黑,

江船火独明。



原创免责:未经授权严禁转载,版权合作及沟通单击本链接
推荐文章