🏠 首页
🤖 什么是AI
📜 历史
🌳 分支
💬 大模型
🔑 Token
🏠 OpenClaw
💡 核心概念
🌍 应用
⚖️ 挑战
🎯 总结
A
Artificial · 人工的
I
Intelligence · 智能
让机器像人一样感知、理解、思考和行动
🤖
🧠
💡
🚀
🔮
↓ 向下滚动开始探索 ↓
什么是人工智能?🤖
AI = 让计算机模拟人类的智能行为。简单说,就是教会机器"看、听、想、做"。
👁️
感知
像人眼一样看懂图片和视频
计算机视觉 CV
识别物体、人脸、文字。
应用在自动驾驶、医学影像、安防监控。
你手机的面部解锁就是CV在驱动。
👂
理解
像人耳一样听懂语言和指令
自然语言处理 NLP
理解语音和文字的含义。
Siri、小爱同学、ChatGPT都是NLP成果。
现在的AI甚至能读懂"言外之意"。
🧠
思考
像人脑一样推理、分析、判断
推理与规划
在海量数据中发现规律。
深度学习自动提取特征。
GPT、Claude已具备很强推理能力。
✋
行动
像人手一样完成任务和创作
AI Agent 智能体
自主执行复杂任务:写代码、做PPT、管理日程。
不只是"你问我答",而是能自主规划和执行。
像一个不知疲倦的全能助手。
AI 发展历程 📜
从1956到2026,70年的进化之路。悬停查看详细故事。
1956
AI概念诞生
达特茅斯会议首次提出"人工智能"
一切的起点
麦卡锡等学者开了两个月研讨会,正式定义AI。
他们以为一个夏天就能解决,结果走了70年。
🎓
Dartmouth 1956
1997
机器战胜人类
IBM深蓝击败国际象棋冠军
首次击败人类冠军
深蓝靠暴力搜索击败卡斯帕罗夫。
全世界第一次意识到:机器也能赢人类。
♟️
IBM Deep Blue
2012
深度学习爆发
AlexNet赢得ImageNet图像识别竞赛
深度学习的黎明
深度CNN把图像识别错误率从26%降到15%。
证明了深度学习的潜力,引发新浪潮。
🔬
AlexNet
2016
AI下围棋
AlphaGo击败世界冠军李世石
围棋圣杯被攻破
围棋局面比宇宙原子还多。AlphaGo 4:1胜出。
AI从此进入公众视野。
⚫
AlphaGo
2017
Transformer架构
Google发表"Attention Is All You Need"
最重要的论文之一
自注意力机制彻底改变NLP。
GPT、BERT、ChatGPT全基于这个架构。
📄
Attention Paper
2022
生成式AI元年
ChatGPT发布,两月用户破亿
AI走进千家万户
普通人第一次感受AI的强大。
聊天、写文章、编代码……全球掀起AI热潮。
💬
ChatGPT
2024
多模态 & 视频生成
Sora视频生成、GPT-4o图像生成
看听做一体化
AI不仅能聊,还能看图、生成图片和视频。
GPT-4o统一文本和视觉。Sora生成视频。
🎬
Sora · GPT-4o
2025-26
AI Agent & 多模态统一
GPT-5 Ultra统一文本/视觉/音频
从"回答"到"解决"
AI能自主规划、调用工具、反思纠错。
多模态底层架构统一,看听做一体化。
从"你问我答"变成"帮你搞定"。
🤖
Agent Era
AI 的主要分支 🌳
AI是一个层次分明的技术家族。从底层基础到上层能力,逐步增强。悬停查看详情。
基础方法 — 一切的地基
🤖
机器学习
从数据中自动学习规律与模式
监督学习 · 无监督学习 · 半监督学习
机器学习 ML
AI的基础方法论。监督(有标签)/ 无监督(聚类)/ 半监督。
所有现代AI应用的地基。
▼ 机器学习的两个重要子集 ▼
核心引擎
🧬
深度学习
神经网络自动提取特征
CNN · Transformer · 扩散模型
深度学习 DL
多层神经网络从数据自动学习。
Transformer是当前最核心的架构。
所有上层能力的引擎。
🎮
强化学习
通过试错和奖励学习策略
AlphaGo · 机器人控制 · 游戏AI
强化学习 RL
Agent在环境中行动,获得奖励/惩罚。
AlphaGo就是经典案例。
也用于机器人控制、游戏。
▼ 深度学习驱动的上层能力 ▼
应用能力
🗣️
自然语言处理
让机器理解和生成语言
NLP
翻译 · 摘要 · 对话 · 情感分析
ChatGPT就是NLP的最新成果
基于Transformer架构
👁️
计算机视觉
让机器看懂图像视频
CV
图像分类 · 目标检测 · 人脸识别
自动驾驶 · 医学影像
基于CNN架构
🎨
生成式AI
AI创作文本/图像/视频
生成式AI
GPT(文本) · DALL-E/Midjourney(图像)
Sora/Runway(视频) · 音乐生成
基于扩散模型/Transformer
大语言模型 (LLM) 💬
当前AI最核心的技术。从文本对话到图像视频生成,已形成完整生态。
📖 什么是大语言模型?
用万亿级文本训练的超大神经网络。学会了语言规律和世界知识,能理解和生成几乎任何内容。
训练三步走:
1️⃣ 预训练
读遍互联网 →
2️⃣ 微调
高质量对话精调 →
3️⃣ RLHF
人类反馈强化
🇺🇸 海外语言模型
Gemini 3.1
Google
Arena综合#1,100万Token窗口
Claude 4.6
Anthropic
Arena#2,编程#1
GPT-5
OpenAI
Arena#3,开创者,多模态统一
Grok 4
xAI
Arena#4,快速崛起
Llama 4
Meta
最强开源模型系列
🇨🇳 国内语言模型
DeepSeek V4
深度求索
Arena全球#5,开源先锋
GLM-5
智谱AI
国产Top2,多模态能力强
通义千问
阿里
Qwen3,企业级,中文强
豆包
字节跳动
C端用户最多,多模态
Kimi
月之暗面
长文本处理,文档分析
🖼️ 图像生成模型
Midjourney
Midjourney
AI绘画标杆,艺术感极强
FLUX
Black Forest Labs
SD创始团队新作,质量极高
DALL·E 3
OpenAI
ChatGPT内置,语义理解强
混元 Image
腾讯
国产最强,80B开源文生图
Stable Diffusion
Stability AI
开源鼻祖,社区生态丰富
🎬 视频生成模型
Seedance 2.0
字节跳动
视频Arena #1,即梦AI
海螺AI
MiniMax
视频Arena #2,动作表现强
可灵 3.0
快手
4K原生,音频同步生成
Sora
OpenAI
视频开创者,物理世界模拟
Veo 3
Google
Google最新视频模型
Runway Gen-3
Runway
老牌视频工具,创作级
Token — AI的"最小货币" 🔑
AI处理文本的最小单位。理解Token,就理解了AI的运作和计费。
🌰 拆一拆 👇
我
Token #1 · 1个中文字 ≈ 1~2 Token
喜欢
Token #2 · 常见词通常整体1 Token
吃
Token #3 · 单字动词
苹果
Token #4~5 · 可能拆成 "苹"+"果"
英文拆法不同 👇
H
Token #1 · 单字母也是Token
ello
Token #2 · 常见后缀整体
world
Token #3 · 常见词=1 Token
!
Token #4 · 标点也是Token
💡 中文 1字 ≈ 1~2 Token
💡 英文 1词 ≈ 1~2 Token
💡 不同模型拆法不同
📏
长度换算
1000字 ≈ 1500 Token
不同模型分词不同
同一句话在GPT和Claude中Token数不同。
中文比英文消耗更多Token。
💰
计费方式
API按Token收费
输入输出价格不同
GPT-4o: 输入$2.5/百万Token,输出$10/百万Token。
输出更贵,精简Prompt能省钱。
🪟
上下文窗口
模型一次能"看到"的上限
越大记忆越长
GPT-4: 128K · Claude: 200K · Gemini: 1M+
窗口满了需要"压缩"旧对话。
⚡
影响速度
Token越多越慢
优化Prompt = 省钱提速
模型速度以 Token/秒衡量。
精简输入是使用AI的关键技能。
OpenClaw — 你的AI管家 🏠
开源自托管AI网关。在手机发消息就能操控电脑,让AI帮你干活。试试模拟器 👇
🤖
luobot 助手
在线
发送
Step 1 · 接收
📱 消息到达网关
消息通过聊天平台到达OpenClaw,注入上下文
Step 2 · 理解
🧠 AI分析意图
模型分析你要做什么,决定调用哪些工具
Step 3 · 执行
🔧 调用工具
AI调用日历/搜索/文件等工具执行操作
Step 4 · 回复
💬 生成自然语言
AI把结果组织成易懂的回复
Step 5 · 记忆
🧠 存入记忆
对话存入记忆文件,下次能记住
OpenClaw 核心概念 💡
从上到下互相配合,构成完整的AI助手系统。悬停查看详情。
🤖
Agent 智能体
AI助手本身
有性格(SOUL)和记忆(MEMORY)
Agent
由SOUL.md(性格)、IDENTITY.md(身份)、MEMORY.md(记忆)定义。
可定制成助手、翻译、分析师等。
⬇ 每次对话创建
💬
Session 会话
一次对话窗口
Token窗口有限
Session
系统提示+对话历史+工具结果。
窗口满了需要压缩。不同Session通过记忆文件传递。
🧠
Context 上下文
模型看到的所有内容
提示+文件+历史+工具
Context
上下文 ≠ 记忆。
上下文是当前窗口里的内容。
管理好上下文是使用AI的关键。
⬇ 可调用
🎯
Skill 技能
可复用指令模板
clawhub.ai
Skill
预定义指令文件,教AI完成特定任务。
社区市场:clawhub.ai
💓
Heartbeat 心跳
定期唤醒检查任务
每30分钟一次
Heartbeat
自动检查邮件、日历、天气等。
在HEARTBEAT.md中自定义。
📱
Node 节点
手机 companion
拍照·定位·通知
Node
手机配对后可远程拍照、定位、推送通知。
支持Android/iOS。
AI 的典型应用 🌍
AI已深入各行各业。悬停查看具体案例。
🏥
医疗健康
诊断辅助 · 药物研发 · 医学影像
医疗AI
AI在皮肤癌识别上已达专业医生水平。
药物研发周期从10年缩短到数月。
医学影像分析准确率超过专科医生。
Watson、DeepMind都有突破性进展。
🏦
金融科技
风险评估 · 智能投顾 · 反欺诈
金融AI
实时分析数百万笔交易,秒级发现异常。
智能投顾根据风险偏好自动配置资产。
量化交易中AI已成标配。
🚗
智能出行
自动驾驶 · 路径优化 · 交通预测
出行AI
特斯拉FSD、Waymo已实现L4自动驾驶。
AI实时分析路况、预测拥堵、规划最优路线。
未来出行方式正在被彻底改变。
📱
日常生活
语音助手 · 推荐 · 翻译 · 创作
生活AI
抖音推荐、语音助手、翻译耳机、AI写作……
AI已无处不在,从早到晚都在服务你。
🏭
工业制造
质检 · 预测维护 · 供应链
工业AI
AI视觉检测比人工快10倍且更准确。
预测设备故障,提前安排维护。
全球供应链优化,减少库存浪费。
🎓
教育学习
个性化教学 · 智能批改 · 知识问答
教育AI
AI根据进度定制内容,像一对一辅导。
自动批改释放教师时间。
ChatGPT已成最受欢迎的"学习伙伴"。
AI 的挑战与伦理 ⚖️
技术越强大,责任越重大。悬停了解详情。
⚠️
数据隐私
训练数据的个人信息保护
隐私挑战
大模型训练需要TB级数据,可能含个人信息。
GDPR等法规提出严格要求。
联邦学习等隐私保护技术在发展。
🎭
深度伪造
AI生成虚假内容,真假难辨
Deepfake
AI可生成以假乱真的照片、视频、声音。
从政治谣言到诈骗,滥用风险巨大。
各国推进AI水印和内容溯源法规。
⚖️
算法偏见
数据偏见导致不公平决策
公平性
亚马逊曾因AI招聘歧视女性而弃用。
训练数据偏见会放大社会不平等。
公平性是AI伦理核心议题。
💼
就业影响
部分工作面临被替代风险
转型而非消亡
麦肯锡预测2030年4亿岗位受影响。
但也会创造新岗位:Prompt工程师等。
关键在于学习和适应。
🔒
安全风险
AI系统可能被恶意利用
AI安全
自动钓鱼、恶意代码生成、绕过安全系统。
AI安全研究正成为关键领域。
确保AI不被恶意操控至关重要。
📜
监管立法
各国加速AI立法进程
全球监管
EU AI Act已生效,中国发布AI治理框架。
美国以行政令推动安全标准。
全球AI监管正在加速。
总结 🎯
AI正在深刻改变世界,而你正站在这个时代的起点。
🌟
AI不会取代人类,
但会用AI的人
会取代不会用的人。
01
AI的本质是让机器
学会看、听、想、做
02
70年积累,从实验室
走进每个人的生活
03
大模型统一了语言、
图像、视频的理解与生成
04
Token是一切的计量单位,
也是理解AI的钥匙
05
开源工具让每个人
都能拥有AI助手
06
技术越强大,越需要
隐私、安全与伦理的约束
开始你的AI之旅 🚀
ChatGPT
OpenClaw
LM Arena