“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
钉钉个人版在内测期间已经进行了多次更新,新增了鹿班相机、灵动人像等多款 AI 工具,为用户提供 AI 写真、数字分身、AI 作画、AI 律师等服务。
项目体验网址:https://top.aibase.com/tool/personalized-restoration-via-dual-pivot-tuning
根据介绍,该行动计划在2024年底前完成超过8万个重点场所的移动网络深度覆盖,覆盖2.5万公里铁路和35万公里公路以及150条地铁线路。
CogAgent作为在CogVLM基础上改进的开源视觉语言模型,拥有更多的功能和性能优势。它支持更高分辨率的视觉输入和对话答题,能够处理超高分辨率图像输入。