有机的 LLM 人机交互: 不只是对话框

有机的 LLM 人机交互

不只是对话框

盐粒 yanli.one

layout: two-cols

Who am I

avatar

盐粒 (yanli.one)


  • Homepage 🌐 yanli.one
  • 📧 mail@yanli.one
  • X (Twitter): x.com/beautyyuyanli
  • Telegram: t.me/yanli_one

::right::


Brew ideas; Craft code.


  • 正在为 NebulaGraph 工作,专注于 Graph + LLM 的探索和实现
  • 以及所有有意思的代码
  • 喜欢咖啡、啤酒和历史小说
  • 还有下厨房和酿酒

layout: center

首先当然还是对话框


layout: two-cols

对话框:

有状态的深度交互


  • 最常见的 LLM 交互形式
  • 场景:问答、信息检索、对话、文字游戏
  • 输入输出:文本或富文本

核心优势:有状态性

  • 记住对话历史
  • 支持多轮深入交互
  • 逐步完成复杂任务

局限性

  • 需要明确表达需求
  • 开放性界面让人不知从何开始

::right::


layout: two-cols

搜索框:聚焦明确查询

两种使用场景

  • 问答:明确问题,疑问词开头
    • "今年 PyCon China 是什么时候?"
    • "Python 的依赖 lock 机制如何运作?"
  • 信息检索:关键词或短语
    • "PyCon China 2025"
    • "PEP 751"

特点

  • 无状态交互模式
  • 每次查询独立
  • 简单高效
  • 深入追问时演进为对话框

::right::


layout: center

集成 LLM 应用

无缝融入工作流程

LLM 不再是独立界面,而是嵌入为软件功能的一部分


layout: center

泛 Copilot:重塑专业创作

核心特点

  • 几乎不改变既有工作流程
  • 巧妙替换某些步骤为 LLM 调用

典型例子

  • 代码编辑器:LSP 补全 → LLM 智能补全
  • 文本编辑器:语法检查 + 文本润色

价值

  • LLM 与内容生产流程深度融合
  • AI 能力成为创作工具的自然延伸

layout: center

文本处理应用

从"不可用"到"很好用"

翻译软件的质变

  • 不再局限于小段文本
  • 胜任全篇文章、整本书籍翻译
  • 专业领域翻译准确性超越人类专家

其他应用提升

  • 语言学习:对话练习、口语对练、作文批改
  • 邮件分类总结
  • RSS 信息订阅和整理

layout: center

原生 LLM 应用

完全依赖 AI 能力的新形态

完全依赖于 LLM 产出文本、序列或数据能力而构建


layout: center

Agent:从简单指令到复杂任务

定义

  • 具有通用性的全能助理程序
  • 用户输入简单指令
  • 根据指令完成复杂任务

两大类型

  1. 产出内容的 agent

    • Deep research:多次迭代产出综合性报告
    • Coding agent:探索代码库,提供精准修改
  2. 执行任务的 agent

    • "点外卖 agent"
    • 价值在于按预期完成实际任务

layout: center

尽管 agent 应用功能强大,但大多数仍然采用对话框作为前端交互形式。


layout: center

更多原生应用可能性

超越文本指令

文本指令的局限

  • 需要大脑措辞思考
  • 物理层面输入动作繁琐
  • 相比下滑、点击等简洁交互更复杂

简单输入方式的探索

  • "一键 xxx"功能:一键转换、一键翻译
  • LLM 作为"魔法按钮"

layout: iframe-right url: https://wikisurf.ing/article/黑林村瘟疫

WikiSurfing: 无限的虚拟维基百科

demo on https://wikisurf.ing

  • 利用超链接机制
  • 构建虚拟百科网站
  • 点击跳转到 LLM 生成页面
  • 重现"网上冲浪"乐趣

layout: center

游戏领域的潜力

  • 角色扮演游戏 (RPG)
  • LLM 提供虚拟无限世界
  • 创造拟人化 NPC
  • NPC 与玩家平等地位

layout: center

从游戏到现实

如果将这种平等地位的 NPC 概念延伸到现实世界,它会呈现出怎样的形态?


layout: center

陪伴者:平等地位的 AI 存在

特征

  • 不在于具备具体功能
  • 能够在心理层面与用户真正交互
  • 要求用户相信其人格化存在
  • 本质是"图灵测试"

实现基础

  • 功能足够丰富强大
  • 从对话交流到数字世界行为
  • 最终延伸至物理世界实际行动

layout: center

总结

多种交互形态系统梳理

  • 基础:对话框和搜索框
  • 集成:泛 Copilot 和文本处理应用
  • 原生:完全依赖 LLM 能力的应用
  • 未来:具有人格化特征的陪伴者

演进脉络

  • 简单文本输入输出
  • 深度集成用户工作流程
  • 创造全新交互体验

layout: center

  • 根据具体场景选择最合适的交互形式
  • 技术自然融入生活和工作
  • 随着 LLM 能力提升,期待更多创新
  • 最终实现人与 AI 和谐共存

layout: center

迈向"有机"的 LLM 人机交互

Presented by 盐粒 (yanli.one)