摩根大通推出多模态文档理解模型DocLLM
体验地址:https://top.aibase.com/tool/inpaint-wechat
9. 多模态AI将成为新常态。苹果公司的Ferret和特斯拉的FSD正在引领潮流。但挑战也会随之而来。视觉、听觉,甚至是感觉?
这一功能的背后是阿里通义实验室自研的视频生成模型Animate Anyone。在Github上,该项目的Star数短短数日就超过1万,被认为是近期大模型领域最受欢迎的大模型算法之一。
截至目前,Midjourney尚未回复Hyperallergic的评论请求,而这一事件也进一步引发了对未受监管的生成式人工智能发展的担忧,包括未来就业和版权侵犯的指控,促使了更多的诉讼和国会听证会。