微软 Bing 团队开源 “Harrier” 多语言嵌入模型微软的 Bing 团队近日宣布开源其最新的词嵌入模型 “Harrier”。该模型在多语言 MTEB v2 基准测试中表现优异,支持超过 100 种语言,为用户提供了更为强大的语言处理能力。Harrier 的训练数据包括超过 20 亿个示例以及来自 GPT 5 的合成数据,采用了 32,000 个词元的上下文窗口,使其在多语言任务中具备更高的准确性和灵活性。…