用 Tiny Stable Diffusion + Pillow 生成带文字的 AI 封面图
AI 生成的图片有个公认的死穴——文字。无论是 Stable Diffusion、DALL-E 还是 Midjourney,生成的文字几乎不可用:乱码、拼写错误、字母变形,根本原因是扩散模型的"文字生成"本质是像素预测,没有字形约束。 ...

AI 生成的图片有个公认的死穴——文字。无论是 Stable Diffusion、DALL-E 还是 Midjourney,生成的文字几乎不可用:乱码、拼写错误、字母变形,根本原因是扩散模型的"文字生成"本质是像素预测,没有字形约束。 ...

Agent 这个词被用烂了。从"会调用几个工具"到"能自主完成复杂项目",都被叫做 Agent。 比较准确的定义是:Agent 是一个循环系统,它持续地观察环境、推理下一步、执行行动,直到完成目标或达到终止条件。和普通的 LLM 调用不同,Agent 不是一问一答——它在一个任务内会自主决定做多少步、用哪些工具、是否需要纠正之前的错误。 ...

2024 年 11 月,Anthropic 发布了 MCP(Model Context Protocol)。这个协议要解决的问题很具体:每个 AI 应用都在各自为战地实现工具调用,没有标准,重复造轮子。 ...

RAG(Retrieval-Augmented Generation,检索增强生成)解决的是一个很实际的问题:大模型的知识有训练截止日期,不知道你公司内部的文档,也可能"一本正经地胡说"。 ...

[我的想法] Snap 裁员:验证焦虑不是心理问题,是正在发生的事实 日期: 2026-04-16 Snap 裁减了 16% 的员工,大约 1000 人。CEO Evan Spiegel 在内部备忘录里说了这么一句话: “AI 工具可以处理重复性任务,预计每年节省 $500M” ...