谷歌Imagen首次开放测试，安卓苹果都能玩，还有AI写作助手

4天前 (11-13 01:28)阅读1回复0

xxhh

管理员
注册排名4
经验值58765
级别管理员
主题11753
回复0

楼主

谷歌Imagen初次开放测试，安卓苹果都能玩，还有AI写做助手

羿阁发自凹非寺

量子位 | 公家号 QbitAI

临近岁尾，谷歌末于放大招了！

刚刚完毕的AI@年度活动上，谷歌一口气发布了四项最新的AIGC手艺功效。

此中最惹人重视的要数文本图像模子Imagen 初次开放测试，敲黑板，此次安卓、苹果都能玩。

其他有趣的产物，还有AI写做协助东西LaMDA Wordcraft、连系Imagen Video和Phenaki优势的超长连接性视频生成模子等等。

并且，除了官方的总结，几位来自谷歌的科学家也在推特分享了本身心中谷歌AI研究的新停顿。

详细有哪些？一路往下看。

Imagen初次开放测试

自推出以来，Imagen不断被与OpenAI的DALL-E 2、Stability AI的Stable Diffusion比拟较，但差别的是，谷歌不断没有将该系统向公家开放。

如今，谷歌末于松口，公布将把Imagen添加到其AI Test Kitchen利用中。

AI Test Kitchen，是本年I/O大会上，谷歌推出的一款用于对各类AI系统停止测试的利用法式，目前苹果、安卓用户都能下载。

最后的时候，用户仅能够在上面与AI聊天机器人LaMDA 2停止交换，此次更新将添加两种与Imagen互动的新体例：城市梦想家和Wobble。

在“城市梦想家”中，你能够用文字号令建造差别主题的城市，此中，Imagen模子承担了创建样本建筑和地块（城市广场、公寓楼、机场等）的感化。

在Wobble中，你能够缔造一个小怪物，DIY它的材量（粘土、毛毡、橡胶等），然后给它穿上你抉择的衣服，还能够戳戳它，让它“跳舞”。

虽然与其他文本到图像的形式比拟，那些互动体例看上往还比力受限造，但谷歌产物治理高级总监乔希·伍德沃德（Josh Woodward）解释称，那一步的意义在于获得公家对那些AI系统的反应，以及测试哪些行为会使得系统瓦解。

其他AIGC产物

除了最受存眷的Imagen模子，谷歌还公布了在其他内容格局上的AI内容生成手艺。

好比LaMDA Wordcraft，一个在大语言模子LaMDA根底上开发的、能辅助专业做家写做的AI写文东西。

它的感化，是在创做者写做的过程傍边，按照现有的文本产生新的设法，或者帮忙重写已有文句，从而帮忙创做者打破“创做瓶颈”。

值得一提的是，下图中的“Evaluative Soliloquies”就是做家刘宇昆（《三体》英文版译者）在Wordcraft帮忙下撰写的短篇小说。

除此之外，谷歌还连系了Imagen Video和Phenaki两大模子的优势，推出了一个能生成超长连接性视频的新模子。

还有AudioLM，一个无需文字和音乐符号操练，仅通过聆听音频样本，就能够陆续生成填补乐曲的音频模子。

说完那些谷歌官方公布的新手艺，让我们再来看看谷歌的科学家们本身是怎么说的。

谷歌科学家眼里的新停顿

除了产物层面，本年谷歌AI研究的新停顿还有哪些？

谷歌大脑的工程师周登勇在推特上分享了本身的观点：大模子学会了若何解释谜底，查抄谜底，并将复杂问题合成成子问题处理。

而那一切还要从谷歌本年1月发布的一篇论文“Chain of Thought Prompting Elicits Reasoning in Large Language Models”起头说起。

就是在那篇论文中，谷歌初次提出了思维链提醒（chain of thought prompting）的概念。

简单来说，思维链提醒就是一种特殊的上下文进修，差别于尺度提醒只是给出输进-输出对的示例（如下图左），思维链提醒还会额外增加一段推理的过程（如下图右）。

那一步的目标是让模子模仿并为当前问题生成本身的思维过程，最末进步生成成果的准确性。

该办法在LaMDA-137B、GPT-3 175B、PaLM-540B三个大型语言模子上都得到了验证：比照尺度提醒，新办法在算术、常识和符号推理使命的准确率上都有了明显的进步。

而且，跟着模子参数量级的提拔，思维链提醒的效果也呈指数级上升。

出格是共同上谷歌的超等语言模子PaLM-540B，在包罗数学问题在内的多个推理基准测试中到达了SOTA程度，以至超越了利用验证器停止微调的GPT-3。

很快，两个月后该团队又对该研究停止了跟进。

那篇文章几乎利用了和初代文章完全一样的数据集和设置，次要改善是提出了一种称为自洽性（self-consistency）的简单战略。

简单来说，就像人在试探时会想出几种差别的处理计划再做出揣度一样，自洽办法会通过思维提醒链从语言模子中摘样一组差别的推理途径，再对谜底停止大都投票（majority vote），最初返回此中最自洽的谜底。

那一步优化不只意味着离模仿人类思维形式更近一步，还做到了显著地进步思维链办法的性能。

最新的停顿是，为领会决从易到难的泛化问题，该团队又提出了一种别致的提醒战略。

它将复杂问题简化为一系列子问题，然后依次处理那些子问题，从而通过对先前处理的子问题的谜底来促进处理给定的子问题。

就如许，谷歌正在操练AI一步步朝着人类的思维形式靠近。

最初，说了那么多，那一年，你印象最深的谷歌AI研究是什么？

— 完 —

量子位 QbitAI · 头条号签约

存眷我们，第一时间获知前沿科技动态

安卓小说

回帖 墨水屏电子阅读器为什么在城市书房、书香军营、聪明图书馆越来越流行？ 双十一这几款桌面好物，我不容许你不知道

谷歌Imagen首次开放测试，安卓苹果都能玩，还有AI写作助手期待您的回复！

取消

谷歌Imagen首次开放测试，安卓苹果都能玩，还有AI写作助手

谷歌Imagen首次开放测试，安卓苹果都能玩，还有AI写作助手 期待您的回复！

谷歌Imagen首次开放测试，安卓苹果都能玩，还有AI写作助手期待您的回复！