Tennisbot v7 是一个基于 OpenAI Agents SDK 的多会话、多 Agent 个人助手。本文从入口与目录结构讲起,沿着 WebUI/CLI 两条执行链路下钻到会话存储、handoff、工具与多模态输入,记录它如何在“可自修”的约束下迭代到可用形态,并给出关键设计取舍与踩坑复盘。
阅读全文 - Read more »

关于埃德蒙顿的野外湖边的一些常见的野草的记录
阅读全文 - Read more »

本表格汇总了常用大语言模型在常用评测榜单上的表现。榜单涵盖人类偏好、知识与推理能力、数学能力、代码能力、多模态能力等多个方面。
This table summarizes the performance of popular large language models across well-known benchmark leaderboards. These rankings cover a range of capabilities, including human preference, knowledge and reasoning, mathematical skills, coding ability, and multimodal performance.
阅读全文 - Read more »