2024-02-20-AI日报

AIGC前沿4个月前发布 admin
856 0 0

1⃣️ 🔊 PixelPlayer:MIT研究团队的创新 自动识别并分离视频中的声音源,匹配画面位置。 为音视频编辑提供强大工具:独立调整音量、去除或增强特定声音源。 核心功能:声音源分离、声音定位、多声音源处理。

🔗 The Sound of Pixels

🔗 [1804.03160] The Sound of Pixels

🔗 https://x.com/xiaohuggg/status/1759916778229268874…

 

2⃣️ 👗 OOTDiffusion:高度可控的虚拟服装试穿工具 高质量服装图像生成与融合,支持半身和全身模型。 可控试穿参数,自然融合与逼真效果。 开源项目,支持在线测试。

🔗 GitHub – levihsu/OOTDiffusion: Official implementa…

🔗 https://ootd.ibot.cn

🔗 https://x.com/xiaohuggg/status/1759876272505942462…

 

3⃣️ 🔄 AnyGPT:跨模态大语言模型 从任意模态到任意多模态的理解与生成。 支持文本、图像、视频、音频等模态输入和输出。 采用离散表示法处理不同模态数据。

🔗 AnyGPT

🔗 https://arxiv.org/pdf/2309.05519.pdf

🔗 https://x.com/xiaohuggg/status/1759823372891090990…

 

4⃣️ 💬 利用Groq实现实时AI对话 结合Llama-70B模型与Whisper模型,实现几乎零延迟性能。 展望:GPT 4或GPT 5可能实现的秒级写作和AI实时通话。

🔗 Groq

🔗 https://x.com/xiaohuggg/status/1759780187074646164…


AI副业赚钱交流群

欢迎大家加入AI副业赚钱交流群,一起学习交流,有单子在群中发布,可接单赚钱。

扫码入微信群AI侦探社

AI副业赚钱群

以上内容由站点小编汇总整理,多数均为第三方内容,旨在帮助大家打破AI信息壁垒,开拓AI赚钱思路。涉及付费内容请您务必自行甄别判断,谨防受骗上当。

© 版权声明

相关文章

暂无评论

暂无评论...