标题 >>

用AI绘画“云避暑”,阿里推出通义万相大模型,相关论文已发表于ICML 2023
用AI绘画“云避暑”,阿里推出通义万相大模型,相关论文已发表于ICML 2023

“小暑不足畏,深居如退藏。”这是金代诗人庞铸写的一首意境唯美的小暑诗《喜夏》。对于古人来说,由于科技还不够发达,他们的避暑方式相对匮乏。作为现代人,我们的消暑和娱乐方式比古人要多得多。比如,傍晚邀三五好友来到夜市大排档,享受啤酒花生小龙虾带来的畅爽滋味;带家人遍游新疆,感受天山天池山水间的自然之美;携密友前往呼伦贝尔大草原,一品风吹草地见牛羊的壮美景观。

但在真正动身之前,我们不妨先用“通义万相”大模型生成包含上述内容的图片,来饱饱眼福。

图丨左:油画风格的花生;右:插画风格的花生(来源:通义万相生成)

图丨左:3D卡通风格的啤酒;右:油画风格的啤酒(来源:通义万相生成)

图丨左:油画风格的小龙虾;右:水彩画风格的小龙虾(来源:通义万相生成)

图丨左:水彩画风格的新疆天山天池;右:油画风格的新疆天山天池(来源:通义万相生成)

图丨左:油画风格的呼伦贝尔大草原;右:默认风格的呼伦贝尔大草原(来源:通义万相生成)

上面所展示的图片正是由通义万相的“文本生成图像”功能完成的。目前,该模型已经开启定向邀测(网址:https://wanxiang.aliyun.com/)。

7月7日,是二十四节气中的小暑节气。同样在这一天,阿里云正式宣布通义万相大模型开启邀测。该模型拥有文生图和图生图的能力,能够帮助我们更好地完成图片创作。

推出AI绘画创作大模型通义万相,首批上线三大功能

据介绍,通义万相首批上线三大功能,除前述“文本生成图像”功能以外,还包括“相似图生成”和“风格迁移”的功能。

具体来说,在文生图功能中,用户输入文字描述画面,选定水彩、油画、3D卡通等创作风格,即可得到由AI生成的、以四张为一组的图片。

在相似图生成功能中,用户提供一张参考图像,即可获取与该图内容和风格相似的图片。在风格迁移功能中,只需要上传原图和风格图,该模型就可以自动将原图处理为指定风格的图片。(注:下图是对后两种功能的测评。)

图丨相似图生成功能测评(来源:通义万相生成)

图丨风格迁移功能测评(来源:通义万相生成)

那么,这些功能的背后,究竟基于怎样的技术?

据了解,通义万相主要基于阿里近期研发的组合式生成模型Composer,后者在扩散模型的基础上采用了“组合式生成”框架。

简单来说,就是通过对包括配色、布局、风格等在内的图像设计元素进行拆解和组合,来提供具有高度可控性和强大自由度的图像生成效果。

图丨合成图像的概念(来源:ICML 2023)

这之中包含了拆解-组合与组合爆炸两种思想。前者先将图像拆解为不同的设计元素,再通过AI模型重新组合新图像,由于过程中用到的元素都可以自由修改和编辑,因此能够在设计元素层面实现可控性。后者则能为定制化图片提供强大的自由度和定制化能力,比如有10张图片,每张图片拆解成8种元素,就可生成10的8次方种组合方式的新图像。

图丨图像重构(来源:ICML 2023)

因此,基于Composer模型,通义万相在保持图像语义内容不变的同时,通过改变图像中局部细节,就能实现相似图生成的功能;在保留原始图片基本形态、结构的同时,迁移风格图片的色彩、笔触、风格等个性化信息,就能实现风格迁移的功能。

此前,相关论文已经以《Composer:具有可组合条件的创造性和可控图像合成》(Composer: Creative and Controllable Image Synthesis with Composable Conditions)为题,发表在机器学习国际顶级会议ICML 2023上。

研发大模型五年之久,深度布局通义系列大模型

作为最早投入大模型研发的企业之一,阿里云于2018年底正式开始研发大模型,但此前其已经在自然语言处理、计算机视觉等领域有着多年的研究积淀。

据介绍,2021年,阿里通义大模型先后发布超百亿参数的多模态大模型及语言大模型;2021年10月,阿里通义大模型以较低能耗训练出10万亿参数大模型;2023年4月7日,通义千问大模型开启邀测,来自油气、电力、交通、金融等行业的七家数字化服务商成为首批合作伙伴,迄今已有超30万企业用户申请;2023年6月,通义听悟正式上线。

其中,通义千问作为大语言模型,能够响应人类用自然语言提出的各种指令,具有问题回答、文字创作、代码编写等能力。通义听悟作为接入通义千问能力的应用型产品,能够帮助用户完成音视频内容的转写、整理、检索和摘要。通义万相作为聚焦图片创作的大模型,可在文创、电商、艺术设计、游戏等领域获得应用,帮助人类大幅降低图片设计门槛。

阿里云CTO周靖人在会上表示:“阿里云将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方位的服务,包括最强大的智能算力和开发工具,并在资金和商业化探索方面提供充分支持。”

大模型研发,不只涉及单一的算法问题,也不可能凭靠简单堆积GPU来实现,其是一个包含底层算力、网络、存储、大数据、AI框架等复杂技术在内的系统性工程。

因此,要想迎上大模型的发展浪潮,降低大模型的研发门槛并真正实现落地应用,必须重视全方位的产业生态建设。

对于阿里云来说,其搭建了一套以AI模型为核心的云计算技术和服务架构,能为大模型初创企业和开发者提供全方位服务,比如模型训练、推理、部署、精调、测评、产业化落地等。

在基础设施层,阿里云拥有国内最强的智能算力储备,其智算集群可支持最大十万卡GPU规模,并能承载多个万亿参数大模型同时在线训练,能为大规模AI集群提供无拥塞通讯的自研RDMA网络架构,以及低成本、高可靠的高性能存储CPFS。

在AI平台层,基于飞天智算的阿里云深度学习平台PAI,可支持万卡的单任务分布式训练规模,将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍,覆盖了全链路AI开发工具与大数据服务。

同时,在开发者生态层,阿里达摩院提出MaaS(Model as a Service,模型即服务)理念,并牵头建设了国内规模最大的AI模型服务社区“魔搭”。

目前,该社区已经集聚了180多万AI开发者和900多个优质AI模型,模型贡献者包括百川智能、哔哩哔哩、IDEA研究院、兰丁股份、澜舟科技、openBMB社区、启智社区等。其中,值得一提的是,他们贡献了30多个10亿参数规模以上的大模型。

(来源:资料图)

“找大模型上魔搭,我们将努力把魔搭社区培育成中国最大的‘大模型自由市场’。”周靖人这样说。

那么,到底该如何理解魔搭社区是中国最大的“大模型自由市场”呢?

如上所述,该社区目前已经成为国内规模最大的AI模型服务社区。在这个平台上,所有的模型生产者都能上传模型、验证能力、探索其应用场景和商业化模式。从这个角度来看,可以认为其是一个充分开放的大模型自由市场。

另外,最近该社区新推出了一款大模型调用工具魔搭GPT(ModelScopeGPT)(网址:https://modelscope.cn/studios/damo/ModelScopeGPT/summary)。该工具可以在接收用户以自然语言发出的指令之后,通过“中枢模型”通义千问调用魔搭社区其他的AI模型,以大小模型协同的形式完成人类布置的复杂任务。目前,其具备完成单一任务、复合任务、多API 规划调用、多轮对话API调用等能力。

魔搭GPT的出现,弥补了现阶段大语言模型应用的短板,其能够充分发挥不同模型的优势之处,辅助人类完成复杂的多模态任务。比如,用户在该工具的对话框输入任务,魔搭GPT会调用多个模型,展示整个任务规划过程。

在阿里云全球商业副总裁黄海清看来,当下正在朝着智能化时代迈进,而云计算凭借高效与多元的算力、创新与普惠的技术和无所不在的智能,将成为智能化时代的创新引擎。

在此发展背景下,阿里云也将不断推进云计算技术创新,依托公共云+AI的优势,服务好大模型创业公司和千行百业,推动产业新生态的共建。

出处:DeepTech深科技

2023-07-09
-

(如不慎侵权,请即联系我站。)
荐读
 · 天文学家最新绘制银河系
 · 未来趋势:只招会编程的营销专家
 · 未来70亿年要发生的事都知道了,现在有点
 · 霍金:黑洞并非永恒监狱,或通往另一宇宙
 · 传谷歌将在欧洲加强信息屏蔽 包括Google
 · 中意专家欲在哈尔滨联手实施世界首例换头
 · 八位科幻史上最强悍的女性
 · 我们是否处在一个计算机模拟的宇宙之中?
 · AlphaGo之后,人类可以用意念控制机器,确
 · 把骨灰做成钻石,这家瑞士公司要火啊!
热搜
 · 看懂《异形:契约》真心不容易
 · 世界上最大的海上执法船:中国“海警290
 · 盘点近年来科幻片中外星人实力排行榜
 · 揭秘电视分辨率:1080p、2K、UHD、4K、8
 · 史上最具影响力的50件科技产品
 · Ai 到底是个什么鬼?
 · 攻克百年难题,扭转“角度” 石墨烯可变超
 · SpaceX实现人类史上首次海上回收火箭,马
 · 图说熊猫“吃相”
 · 美国海军的重要作战支柱:移动目标用户卫
浏览
 · 马斯克的宽带互联网卫星
 · 公益影片《大自然在说话》 | 周迅和汤唯献
 · 当小天体撞击地球,我们能做的有这些...
 · 当VR遇上女主播,这已经不是直播了,是要
 · 遥远宇宙的某个角落,必存在一个长得与你
 · 在AIGC魔法世界里,你是麻瓜吗?
 · 全球首例换头手术暂定2017年底,中国人要
 · 无芯片不AI
 · 芯片内部长啥样?牛人用1500张照片,一层
 · 如果你有多余的想象力,请安放在手机上
如版面不完整 请使用浏览器的【极速模式】

Ai时代(Ai.th1w.com)
E-mail:wx24cn@163.com
苏ICP备14015491号-1 苏公网安备32053150316245