AI文摘

blog-thum
Claude3惊喜上线:多模态能力比肩GPT-4V

Anthropic强势归来。作者丨赖文昕、郭思编辑丨陈彩娴过去不到一个月,OpenAI扔出Sora这个重磅炸弹后成为全球焦点,不断推出的视频更是赚足眼球、热度不减。昨晚,Anthropic突

read more
blog-thum
大语言模型知识蒸馏最新综述!!

本文转自专知本综述深入探讨了大型语言模型(LLMs)领域内的知识蒸馏(KD)技术,突出了KD在将GPT-4等专有巨头的复杂能力转移至LLaMA和Mistral等可访问的开源模型中的关键作用。在不断演变

read more