IBM发布Granite 4.1
IBM Granite团队发布Granite 4.1 dense LLM家族,包含3B、8B和30B模型,训练约15T tokens并支持最高512K长上下文。模型经SFT和GRPO强化学习优化,8B instruct宣称可匹敌或超过上一代32B MoE小模型,并以Apache 2.0开源。
IBM Granite团队发布Granite 4.1 dense LLM家族,包含3B、8B和30B模型,训练约15T tokens并支持最高512K长上下文。模型经SFT和GRPO强化学习优化,8B instruct宣称可匹敌或超过上一代32B MoE小模型,并以Apache 2.0开源。
Hugging Face宣布DeepInfra成为Hub上的Inference Provider,开发者可在模型页面及JS、Python SDK中直接调用。DeepInfra提供覆盖100多个模型的无服务器推理服务,主打较低token价格和快速集成。