它10秒做出一个网站,考试能力超90%人类 它会创作,能逻辑推算,已有超650家企业接入

GPT-4美国登场 文心一言中国出道

版次:007    作者:来源:    2023年03月17日

考试能力超90%的人类、能识图、能算税务,ChatGPT已摆脱“Chat”,再次进化。

3月15日凌晨,ChatGPT的开发者OpenAI正式发布了升级后的GPT-4。在官方博文中,OpenAI写道:“我们创建了GPT-4,这是OpenAI努力扩展深度学习的最新里程碑。”

3月16日,在百度文心一言发布会上,百度创始人、董事长兼首席执行官李彦宏表示,百度是首个发布类似ChatGPT产品的公司。早在2月7日,百度公司便官宣正在进行ChatGPT竞品的上线冲刺,该项目名字确定为文心一言,英文名ERNIE Bot。

GPT-4就是这么牛

当AI有了眼睛

此前GPT还只有大脑,如果有了眼睛和耳朵,让它能够看懂人类的各种图像、视频,听懂各种音频,它的知识存储将会突飞猛进,智能化水平也将同步提升。

在官方演示中,GPT-4可以识别手绘网页草图,并仅用十秒钟左右,就根据草图写出网站代码。

有用户输入图片问:能解释一下这个表情包吗?GPT-4回答说,有时候我只是从太空看地球的照片,我惊叹于地球是多么的美丽——在识别图像方面,它已经有了联想能力。

在官方演示中,输入图片并询问“这张图片有什么不寻常之处”,GPT-4回答:“这张照片的不同寻常之处在于,一名男子正在行驶中的出租车车顶上,使用熨衣板熨烫衣服。”

看图写代码

OpenAI的总裁和联合创始人Greg Brockman在YouTube上的Live Demo中,展示了GPT-4拥有的强大技能:在草稿本上用纸笔画出一个非常粗糙的草图,拍照并上传,GPT-4在10秒左右直接生成了网站代码。

相比于ChatGPT,GPT-4目前具备更好的创造性。能够在创意和技术写作任务中与用户一起生成、编辑和迭代“风格”,例如创作歌曲、编写剧本或学习用户的写作风格进行生成内容;视觉输入上,GPT-4可以识别输入图片并生成标题、说明、分类和分析;同时,GPT-4具备更长的上下文处理能力,能够处理超过25000个单词的文本,并可以直接将链接加入到提问内容中。

推理能力更强

此外,GPT-4的高级推理能力也超越了ChatGPT。在简单的谈话中,ChatGPT与GPT-4可能看不出太大差距。但是,当任务的复杂性达到足够的阈值时,差异就会出现——GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。

OpenAI表示,目前GPT-4已嵌入到多类应用当中,包括语言学习应用程序Duolingo、计算机视觉应用程序Be My Eyes,以及使用GPT-4组织其内部知识库的摩根士丹利财富管理公司。

目前,OpenAI将GPT-4提供给ChatGPT Plus的付费客户;对于开发者而言,则需要访问GPT-4 API,通过等待GPT-4候补名单加入。

文心一言正式发布

3月16日,在百度文心一言发布会上,李彦宏指出,过去一个月内,尽管从文心一言的内测版本来看并非完美,但之所以今天发布是因为有市场需求。“百度各个产品线,从搜索到智能云到自动驾驶到小度,再到合作伙伴都在等着我们的发布;另一方面,发布后的用户反馈也能够帮助提升产品迭代。”

在现场,李彦宏进行了文心一言的演示。从演示中可见,文心一言在面对文学创作、商业文案创作、逻辑推算、中文理解及多模态生成等方面,能够生成自己的答案。

“目前文心一言的相关能力仍在持续完善中,其进步速度非常快,在未来一段时间内一定是日新月异的状态。”李彦宏表示,“通过对文心一言进行微调,可适用于百度内外的各类产品,它在用户界面展现出惊人的亲和力,让每个产品能够更好地理解用户。”

在文心一言背后,是人工智能的全新浪潮。李彦宏提及,未来诸如文心一言大语言模型会成为每个人必不可少的工具。而任何公司都无法靠突击几个月就能做出这般大语言模型。“深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

相较于互联网时代,人工智能时代的IT技术栈增长至芯片层、框架层、模型层以及应用层。李彦宏指出,百度是全球为数不多、在四层进行全栈布局的人工智能公司。

其中,文心一言位于模型层。2019年,百度推出了文心大模型ERNIE1.0。目前,ERNIE3.0每天接受数十亿次用户的搜索请求。这让文心一言能够基于一个庞大的、高效的数据池,快速地学习和改进。

李彦宏还提及大模型训练问题。他指出,大模型训练堪称暴力美学,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。“事实上,超大规模模型的训练和推理,给深度学习框架带来了很大考验。比如,为了支持千亿参数模型的高效分布式训练,百度飞桨专门研发了4D混合并行技术。”

李彦宏指出,自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。“很多的企业已经理解到,文心一言和生成式AI,代表了一个新的技术范式,是每家企业都不可以错过的巨大机会。AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。”

惊喜

GPT-4在哪些方面

超越ChatGPT?

1.学会了更加精确

AI专家克里斯·尼科尔森告诉GPT-4,要求提供一份可以教他西班牙语基础知识的教学大纲,而机器人提供了一个详细且组织良好的教学大纲。它甚至提供了广泛的学习和记忆西班牙语单词的技巧,“它已经突破了精确方面的障碍。”尼科尔森说。

它还可回答有关图像的问题。比如给出冰箱内部的照片,它可建议用手头的东西做几顿饭。

2.增加了严肃的专业知识

北卡罗来纳大学心脏病专家阿尼尔·盖希向聊天机器人描述了他一天前接待的一位患者的病症。描述中包含几个外行人无法识别的医学术语。当盖希医生问它该如何治疗病人时,聊天机器人给出了完美的答案。“这正是我们治疗病人的方式。”他说。

3.可以通过标准化考试

OpenAI表示,新系统在美国41个州和地区的律师资格考试中获得的分数,排名前10%左右。根据该公司的测试,它还可以在SAT考试中获得1300分(满分1600分),在生物、微积分、宏观经济学、心理学、统计学和历史等先修课程高中考试中获得5分(满分5分)。而更早的版本未能通过律师资格考试,在大多数大学先修考试中的得分也没有那么高。

4.它仍然有“幻觉”

新机器人仍在编造东西,这个问题被称为“幻觉(hallucination)”,困扰着所有领先的聊天机器人。因为系统不了解什么是真什么是假,它们可能会生成完全错误的文本,比如完全不存在的互联网地址。它也不擅长讨论未来。

担忧

一旦有了“手”“脚”

或拥有操控世界的能力

无论是四个月前的ChatGPT,还是近期最新迭代的GPT-4,都给科技界带来了无限遐想和期待,也点燃了不少人的焦虑。ChatGPT这项技术可能引发哪些问题?人类应该感到害怕吗?如何实现大规模的商用?

记者采访360集团董事长周鸿祎,问及ChatGPT的终极进化形态及其潜在危害时,他曾推测,若从危机的角度来看,第一步,ChatGPT可能很快就会产生意识。目前ChatGPT仅仅用到了认知。那么,随着撬动ChatGPT的参数进一步扩大,当知识足够多时,有没有可能也会触发它的某种突变,从混沌中催生意识?比如当ChatGPT的模型超过1000亿参数后,或许就产生了神奇的突变,产生了主动推理、举一反三的能力。

第二步,它进化出“眼睛”“耳朵”“手”跟“脚”。目前GPT还只有大脑,如果给它加上眼睛和耳朵,让它能够看懂人类的各种图像、视频,听懂各种音频,届时它的知识存储将会突飞猛进,智能化水平也将同步提升。更进一步,随着ChatGPT接入互联网的API,进入万物互联的时代,它无疑相当于拥有了手跟脚,间接拥有了操控世界的能力。

“但是,我们不能因此就不发展技术,而是要知道技术的底线和边界在哪,从而去规范技术向着正确的方向发展。”周鸿祎强调。

对于ChatGPT以及GPT-4掀起的热潮,中国工程院院士、前北京邮电大学校长、网络空间安全专家方滨兴接受记者采访谈了自己的看法。他特别指出,从安全角度,要警惕ChatGPT形成知识茧房,也要警惕应用GPT的智能行为体可能伤害人类。“GPT的知识背景会产生生命意识。现在所有机器人都没有自我意识,(如果)有一天(它)认为需要自我保护,比如怎么充电,防止别人卸载它的部件等。而它想保护自己不被伤害,一个重要的保护方式可能就是伤害对方。”方滨兴说。

据成都商报-红星新闻、21世纪经济报道