官网地址:https://top.aibase.com/tool/midreal-ai
钉钉个人版在内测期间已经进行了多次更新,新增了鹿班相机、灵动人像等多款 AI 工具,为用户提供 AI 写真、数字分身、AI 作画、AI 律师等服务。
与GPT-4V进行比较时,实验发现GPT-4V在所有对象识别任务中表现一致,但在对象级感知方面落后于VCoder。
据悉,M2UGen采用了创新的方法,生成了大规模的多模态音乐指导数据集,用于训练模型。这包括MU-LLaMA模型生成的1.2k多小时音乐字幕数据集。模型结合了MU-LLaMA、BLIP图像字幕模型、MPT-7B-Chat模型以及VideoMAE字幕模型,以在各个领域生成对应的指导。