特斯拉前AI总监、OpenAI创始成员Karpathy最近扔了个“技术炸弹”,他刚开源的项目nanochat,在GitHub上没几天就飙到14.5kStar。 这东西跟他之前搞的nanoGPT完全不一样,nanoGPT只算个“半成品”,只能做模型预训练,而nanochat是套全流程工具,从训练模型到跟模型聊天 ...
随着人工智能(AI)技术的迅猛发展,编程行业正在经历前所未有的变革。自动化编码工具的普及和AI技术的广泛应用,使得传统意义上的编程工作正逐渐被重新定义。在这样的背景下,未来的程序员需要具备哪些新的技能和素质,才能在AI浪潮中脱颖而出?
InfoQ中国 on MSN
使用ONNX将AI推理引入Java:企业架构师实践指南
引言尽管Python在机器学习生态系统中占据主导地位,但大多数企业应用仍然运行在Java上。这种不匹配性造成了部署瓶颈。在PyTorch或Hugging Face中训练的模型通常需要REST包装器、微服务或多语言等变通方法才能在生产环境中运行。这些方式增加了延迟,增加了复杂性,并使可控性受到了影响。 对于企业架构师来说,这个挑战是非常熟悉的:我们如何在不破坏基于Java系统的简单性、可观测性和可靠 ...
HF上,DeepSeek开源OCR模型⬆️今天,DeepSeek开源了最新的模型:DeepSeek-OCR。省流:模型仅3B,单张A100-40G卡每天可跑20万页的LLM/VLM训练数据。更详细来说:DeepSeek提出了一种新的研究——上下文光学压缩,并通过DeepSeek-OCR模型验证了可行性。实验显示,当文本token数量不超过视觉token的10倍(压缩比低于10×)时, ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果