重庆晨报-GPT-4美国登场文心一言中国出道

它10秒做出一个网站，考试能力超90%人类它会创作，能逻辑推算，已有超650家企业接入

GPT-4美国登场文心一言中国出道

版次：007 作者：来源： 2023年03月17日

考试能力超90%的人类、能识图、能算税务，ChatGPT已摆脱“Chat”，再次进化。

3月15日凌晨，ChatGPT的开发者OpenAI正式发布了升级后的GPT-4。在官方博文中，OpenAI写道：“我们创建了GPT-4，这是OpenAI努力扩展深度学习的最新里程碑。”

3月16日，在百度文心一言发布会上，百度创始人、董事长兼首席执行官李彦宏表示，百度是首个发布类似ChatGPT产品的公司。早在2月7日，百度公司便官宣正在进行ChatGPT竞品的上线冲刺，该项目名字确定为文心一言，英文名ERNIE Bot。

GPT-4就是这么牛

当AI有了眼睛

此前GPT还只有大脑，如果有了眼睛和耳朵，让它能够看懂人类的各种图像、视频，听懂各种音频，它的知识存储将会突飞猛进，智能化水平也将同步提升。

在官方演示中，GPT-4可以识别手绘网页草图，并仅用十秒钟左右，就根据草图写出网站代码。

有用户输入图片问：能解释一下这个表情包吗？GPT-4回答说，有时候我只是从太空看地球的照片，我惊叹于地球是多么的美丽——在识别图像方面，它已经有了联想能力。

在官方演示中，输入图片并询问“这张图片有什么不寻常之处”，GPT-4回答：“这张照片的不同寻常之处在于，一名男子正在行驶中的出租车车顶上，使用熨衣板熨烫衣服。”

看图写代码

OpenAI的总裁和联合创始人Greg Brockman在YouTube上的Live Demo中，展示了GPT-4拥有的强大技能：在草稿本上用纸笔画出一个非常粗糙的草图，拍照并上传，GPT-4在10秒左右直接生成了网站代码。

相比于ChatGPT，GPT-4目前具备更好的创造性。能够在创意和技术写作任务中与用户一起生成、编辑和迭代“风格”，例如创作歌曲、编写剧本或学习用户的写作风格进行生成内容；视觉输入上，GPT-4可以识别输入图片并生成标题、说明、分类和分析；同时，GPT-4具备更长的上下文处理能力，能够处理超过25000个单词的文本，并可以直接将链接加入到提问内容中。

推理能力更强

此外，GPT-4的高级推理能力也超越了ChatGPT。在简单的谈话中，ChatGPT与GPT-4可能看不出太大差距。但是，当任务的复杂性达到足够的阈值时，差异就会出现——GPT-4比GPT-3.5更可靠、更有创意，并且能够处理更细微的指令。

OpenAI表示，目前GPT-4已嵌入到多类应用当中，包括语言学习应用程序Duolingo、计算机视觉应用程序Be My Eyes，以及使用GPT-4组织其内部知识库的摩根士丹利财富管理公司。

目前，OpenAI将GPT-4提供给ChatGPT Plus的付费客户；对于开发者而言，则需要访问GPT-4 API，通过等待GPT-4候补名单加入。

文心一言正式发布

3月16日，在百度文心一言发布会上，李彦宏指出，过去一个月内，尽管从文心一言的内测版本来看并非完美，但之所以今天发布是因为有市场需求。“百度各个产品线，从搜索到智能云到自动驾驶到小度，再到合作伙伴都在等着我们的发布；另一方面，发布后的用户反馈也能够帮助提升产品迭代。”

在现场，李彦宏进行了文心一言的演示。从演示中可见，文心一言在面对文学创作、商业文案创作、逻辑推算、中文理解及多模态生成等方面，能够生成自己的答案。

“目前文心一言的相关能力仍在持续完善中，其进步速度非常快，在未来一段时间内一定是日新月异的状态。”李彦宏表示，“通过对文心一言进行微调，可适用于百度内外的各类产品，它在用户界面展现出惊人的亲和力，让每个产品能够更好地理解用户。”

在文心一言背后，是人工智能的全新浪潮。李彦宏提及，未来诸如文心一言大语言模型会成为每个人必不可少的工具。而任何公司都无法靠突击几个月就能做出这般大语言模型。“深度学习、自然语言处理，需要多年的坚持和积累，没法速成。”

相较于互联网时代，人工智能时代的IT技术栈增长至芯片层、框架层、模型层以及应用层。李彦宏指出，百度是全球为数不多、在四层进行全栈布局的人工智能公司。

其中，文心一言位于模型层。2019年，百度推出了文心大模型ERNIE1.0。目前，ERNIE3.0每天接受数十亿次用户的搜索请求。这让文心一言能够基于一个庞大的、高效的数据池，快速地学习和改进。

李彦宏还提及大模型训练问题。他指出，大模型训练堪称暴力美学，需要有大算力、大数据和大模型，每一次训练任务都耗资巨大。“事实上，超大规模模型的训练和推理，给深度学习框架带来了很大考验。比如，为了支持千亿参数模型的高效分布式训练，百度飞桨专门研发了4D混合并行技术。”

李彦宏指出，自2月份百度官宣“文心一言”以来，已有超过650家企业宣布接入文心一言生态。“很多的企业已经理解到，文心一言和生成式AI，代表了一个新的技术范式，是每家企业都不可以错过的巨大机会。AI市场即将迎来爆发性的需求增长，其商业价值的释放将是前所未有的、指数级的。”

惊喜

GPT-4在哪些方面

超越ChatGPT？

1.学会了更加精确

AI专家克里斯·尼科尔森告诉GPT-4，要求提供一份可以教他西班牙语基础知识的教学大纲，而机器人提供了一个详细且组织良好的教学大纲。它甚至提供了广泛的学习和记忆西班牙语单词的技巧，“它已经突破了精确方面的障碍。”尼科尔森说。

它还可回答有关图像的问题。比如给出冰箱内部的照片，它可建议用手头的东西做几顿饭。

2.增加了严肃的专业知识

北卡罗来纳大学心脏病专家阿尼尔·盖希向聊天机器人描述了他一天前接待的一位患者的病症。描述中包含几个外行人无法识别的医学术语。当盖希医生问它该如何治疗病人时，聊天机器人给出了完美的答案。“这正是我们治疗病人的方式。”他说。

3.可以通过标准化考试

OpenAI表示，新系统在美国41个州和地区的律师资格考试中获得的分数，排名前10%左右。根据该公司的测试，它还可以在SAT考试中获得1300分（满分1600分），在生物、微积分、宏观经济学、心理学、统计学和历史等先修课程高中考试中获得5分（满分5分）。而更早的版本未能通过律师资格考试，在大多数大学先修考试中的得分也没有那么高。

4.它仍然有“幻觉”

新机器人仍在编造东西，这个问题被称为“幻觉（hallucination）”，困扰着所有领先的聊天机器人。因为系统不了解什么是真什么是假，它们可能会生成完全错误的文本，比如完全不存在的互联网地址。它也不擅长讨论未来。

担忧

一旦有了“手”“脚”

或拥有操控世界的能力

无论是四个月前的ChatGPT，还是近期最新迭代的GPT-4，都给科技界带来了无限遐想和期待，也点燃了不少人的焦虑。ChatGPT这项技术可能引发哪些问题？人类应该感到害怕吗？如何实现大规模的商用？

记者采访360集团董事长周鸿祎，问及ChatGPT的终极进化形态及其潜在危害时，他曾推测，若从危机的角度来看，第一步，ChatGPT可能很快就会产生意识。目前ChatGPT仅仅用到了认知。那么，随着撬动ChatGPT的参数进一步扩大，当知识足够多时，有没有可能也会触发它的某种突变，从混沌中催生意识？比如当ChatGPT的模型超过1000亿参数后，或许就产生了神奇的突变，产生了主动推理、举一反三的能力。

第二步，它进化出“眼睛”“耳朵”“手”跟“脚”。目前GPT还只有大脑，如果给它加上眼睛和耳朵，让它能够看懂人类的各种图像、视频，听懂各种音频，届时它的知识存储将会突飞猛进，智能化水平也将同步提升。更进一步，随着ChatGPT接入互联网的API，进入万物互联的时代，它无疑相当于拥有了手跟脚，间接拥有了操控世界的能力。

“但是，我们不能因此就不发展技术，而是要知道技术的底线和边界在哪，从而去规范技术向着正确的方向发展。”周鸿祎强调。

对于ChatGPT以及GPT-4掀起的热潮，中国工程院院士、前北京邮电大学校长、网络空间安全专家方滨兴接受记者采访谈了自己的看法。他特别指出，从安全角度，要警惕ChatGPT形成知识茧房，也要警惕应用GPT的智能行为体可能伤害人类。“GPT的知识背景会产生生命意识。现在所有机器人都没有自我意识，（如果）有一天（它）认为需要自我保护，比如怎么充电，防止别人卸载它的部件等。而它想保护自己不被伤害，一个重要的保护方式可能就是伤害对方。”方滨兴说。

据成都商报-红星新闻、21世纪经济报道

GPT-4美国登场 文心一言中国出道

GPT-4美国登场文心一言中国出道