人工智能
共 10 篇文章
人工智能
大语言模型横向评测:GPT-4.5 是不是真的不行?
本次横向评测对来自六大公司的 13 个最新大语言模型进行了全面评估,旨在探究 OpenAI GPT-4.5 的真实水平,并构建大语言模型能力图谱。
13 分钟阅读
LLM EvaluationAI ModelBenchmark
人工智能
Anthropic 发布 Claude 3.7 Sonnet:性能与编程能力双重飞跃
Anthropic 发布了最新 AI 模型 Claude 3.7 Sonnet,该模型在性能和编程能力上均有显著提升。其独特的混合推理引擎,兼具快速响应和深度思考能力,并允许用户控制思考时间。Claude 3.7 Sonnet 在多项基准测试中表现优异,尤其在 Agentic 编码方面达到业界领先水平。文章详细介绍了模型特性、测评结果、行业评价以及实际应用,并探讨了 AI 编程的未来。同时,Anthropic 也推出了 AI 编程工具 Claude Code。
14 分钟阅读
AnthropicClaude 3.7 SonnetAI Model
人工智能
LangMem SDK 发布:赋能 AI Agent 长期记忆[译]
LangMem SDK 正式发布!本文详细介绍了 LangMem SDK 的各项功能,包括语义记忆、程序记忆和情景记忆,以及如何利用这些功能构建具备长期记忆、持续学习和个性化能力的 AI Agent。
8 分钟阅读
AI AgentLong-term MemoryLangMem
人工智能
专为向量搜索而生[译]
本文论述了专用向量数据库在处理大规模、高性能向量搜索任务上的优势。通过对比通用数据库的向量扩展,强调了专用数据库在架构、性能和对前沿技术支持方面的优越性,指出其更适合对性能和扩展性有高要求的应用场景。
20 分钟阅读
Vector SearchVector DatabaseEmbeddings
人工智能
智能体的规划能力[译]
本文深入探讨了 AI Agent 的规划能力这一关键挑战,分析了当前 LLM 在规划和推理方面的局限性,并介绍了通用认知架构与特定领域认知架构两种改进方案。通过实际案例展示了如何构建更可靠的 Agent 系统,以及未来发展趋势。
8 分钟阅读
AI AgentPlanningCognitive Architecture
![智能体的记忆[译]](/_next/image?url=https%3A%2F%2Fmedia.ginonotes.com%2Fcovers%2Fcover_memory_for_agents.jpeg&w=1200&q=75)

![智能体的交互模式[译]](/_next/image?url=https%3A%2F%2Fmedia.ginonotes.com%2Fcovers%2Fcover_ux_for_agents.jpeg&w=1200&q=75)

![LangMem SDK 发布:赋能 AI Agent 长期记忆[译]](/_next/image?url=https%3A%2F%2Fmedia.ginonotes.com%2Fcovers%2Fcover_langmem.jpeg&w=1200&q=75)
![专为向量搜索而生[译]](/_next/image?url=https%3A%2F%2Fmedia.ginonotes.com%2Fcovers%2Fcover_qdrant_vector_db.jpeg&w=1200&q=75)

![智能体的规划能力[译]](/_next/image?url=https%3A%2F%2Fmedia.ginonotes.com%2Fcovers%2Fcover_agent_planing.jpeg&w=1200&q=75)
![为什么你应该外包智能体基础设施,但保留自己的认知架构[译]](/_next/image?url=https%3A%2F%2Fmedia.ginonotes.com%2Fcovers%2Fcover-own-cognitive-architecture.jpeg&w=1200&q=75)
![什么是认知架构?[译]](/_next/image?url=https%3A%2F%2Fmedia.ginonotes.com%2Fcovers%2Fcover_cognitive_architecture.jpeg&w=1200&q=75)