HumanSplat是一种能够从单张输入图像预测3D高斯分摊属性的通用化方法。
RTranslator 是世界首款开源的实时翻译应用,支持多人多语言对话。
Chatbot Arena 现在支持图片上传
EscherNet是一个通过多视图条件编码实现高精度与连续相机变换的生成式模型。
IMS-Toucan麻省理工学院授权的 7000 种语言的文本转语音
TaskMeAnything是一个生成大规模多模态语言模型(MLM)基准测试的引擎。