谷歌Imagen首次开放测试,安卓苹果都能玩,还有AI写作助手

4天前 (11-13 01:28)阅读1回复0
xxhh
xxhh
  • 管理员
  • 注册排名4
  • 经验值58765
  • 级别管理员
  • 主题11753
  • 回复0
楼主

谷歌Imagen初次开放测试,安卓苹果都能玩,还有AI写做助手

羿阁 发自 凹非寺

量子位 | 公家号 QbitAI

临近岁尾,谷歌末于放大招了!

刚刚完毕的AI@年度活动上,谷歌一口气发布了四项最新的AIGC手艺功效。

此中最惹人重视的要数文本图像模子Imagen 初次开放测试,敲黑板, 此次安卓、苹果都能玩。

其他有趣的产物,还有AI写做协助东西LaMDA Wordcraft、连系Imagen Video和Phenaki优势的超长连接性视频生成模子等等。

并且,除了官方的总结,几位来自谷歌的科学家也在推特分享了本身心中谷歌AI研究的新停顿。

详细有哪些?一路往下看。

Imagen初次开放测试

自推出以来,Imagen不断被与OpenAI的DALL-E 2、Stability AI的Stable Diffusion比拟较,但差别的是,谷歌不断没有将该系统向公家开放。

如今,谷歌末于松口,公布将把Imagen添加到其AI Test Kitchen利用中。

AI Test Kitchen,是本年I/O大会上,谷歌推出的一款用于对各类AI系统停止测试的利用法式,目前苹果、安卓用户都能下载。

最后的时候,用户仅能够在上面与AI聊天机器人LaMDA 2停止交换,此次更新将添加两种与Imagen互动的新体例:城市梦想家和Wobble。

在“城市梦想家”中,你能够用文字号令建造差别主题的城市,此中,Imagen模子承担了创建样本建筑和地块 (城市广场、公寓楼、机场等)的感化。

在Wobble中,你能够缔造一个小怪物,DIY它的材量 (粘土、毛毡、橡胶等),然后给它穿上你抉择的衣服,还能够戳戳它,让它“跳舞”。

虽然与其他文本到图像的形式比拟,那些互动体例看上往还比力受限造,但谷歌产物治理高级总监乔希·伍德沃德 (Josh Woodward)解释称,那一步的意义在于获得公家对那些AI系统的反应,以及测试哪些行为会使得系统瓦解。

其他AIGC产物

除了最受存眷的Imagen模子,谷歌还公布了在其他内容格局上的AI内容生成手艺。

好比LaMDA Wordcraft,一个在大语言模子LaMDA根底上开发的、能辅助专业做家写做的AI写文东西。

它的感化,是在创做者写做的过程傍边,按照现有的文本产生新的设法,或者帮忙重写已有文句,从而帮忙创做者打破“创做瓶颈”。

值得一提的是,下图中的“Evaluative Soliloquies”就是做家刘宇昆 (《三体》英文版译者)在Wordcraft帮忙下撰写的短篇小说。

除此之外,谷歌还连系了Imagen Video和Phenaki两大模子的优势,推出了一个能生成超长连接性视频的新模子。

还有AudioLM,一个无需文字和音乐符号操练,仅通过聆听音频样本,就能够陆续生成填补乐曲的音频模子。

说完那些谷歌官方公布的新手艺,让我们再来看看谷歌的科学家们本身是怎么说的。

谷歌科学家眼里的新停顿

除了产物层面,本年谷歌AI研究的新停顿还有哪些?

谷歌大脑的工程师周登勇在推特上分享了本身的观点:大模子学会了若何解释谜底,查抄谜底,并将复杂问题合成成子问题处理。

而那一切还要从谷歌本年1月发布的一篇论文“Chain of Thought Prompting Elicits Reasoning in Large Language Models”起头说起。

就是在那篇论文中,谷歌初次提出了思维链提醒 (chain of thought prompting)的概念。

简单来说,思维链提醒就是一种特殊的上下文进修,差别于尺度提醒只是给出输进-输出对的示例 (如下图左),思维链提醒还会额外增加一段推理的过程 (如下图右)。

那一步的目标是让模子模仿并为当前问题生成本身的思维过程,最末进步生成成果的准确性。

该办法在LaMDA-137B、GPT-3 175B、PaLM-540B三个大型语言模子上都得到了验证:比照尺度提醒,新办法在算术、常识和符号推理使命的准确率上都有了明显的进步。

而且,跟着模子参数量级的提拔,思维链提醒的效果也呈指数级上升。

出格是共同上谷歌的超等语言模子PaLM-540B,在包罗数学问题在内的多个推理基准测试中到达了SOTA程度,以至超越了利用验证器停止微调的GPT-3。

很快,两个月后该团队又对该研究停止了跟进。

那篇文章几乎利用了和初代文章完全一样的数据集和设置,次要改善是提出了一种称为自洽性 (self-consistency)的简单战略。

简单来说,就像人在试探时会想出几种差别的处理计划再做出揣度一样,自洽办法会通过思维提醒链从语言模子中摘样一组差别的推理途径,再对谜底停止大都投票 (majority vote),最初返回此中最自洽的谜底。

那一步优化不只意味着离模仿人类思维形式更近一步,还做到了显著地进步思维链办法的性能。

最新的停顿是,为领会决从易到难的泛化问题,该团队又提出了一种别致的提醒战略。

它将复杂问题简化为一系列子问题,然后依次处理那些子问题,从而通过对先前处理的子问题的谜底来促进处理给定的子问题。

就如许,谷歌正在操练AI一步步朝着人类的思维形式靠近。

最初,说了那么多,那一年,你印象最深的谷歌AI研究是什么?

— 完 —

量子位 QbitAI · 头条号签约

存眷我们,第一时间获知前沿科技动态

0
回帖

谷歌Imagen首次开放测试,安卓苹果都能玩,还有AI写作助手 期待您的回复!

取消