自然语言处理是目前最广泛的 AI 应用领域之一,依托大语言模型的能力,实现文本理解、生成、对话、信息提取等多种功能。
| 应用方向 | 场景 | 说明 |
|---|
| 文本生成 | 内容创作、摘要撰写、对联、写稿 | ChatGPT、AI写作 |
| 对话系统 | 智能客服、企业机器人、语音助手 | 客服对话、知识问答 |
| 情感分析 | 舆情监控、评论分析 | 识别正负面态度 |
| 文本分类 | 垃圾邮件识别、意图识别 | 精准投放、问答意图识别 |
| 命名实体识别 | 人名、地名、组织提取 | 搜索、风控、金融 |
| 机器翻译 | 多语种翻译、实时字幕 | 百度翻译、Google Translate |
| 文档理解 | 法律、合同、财报理解 | 智能标注、知识抽取 |
| 代码生成 | 自动补全、Bug 解释、文档生成 | Copilot、ChatGPT Code Interpreter |
计算机视觉使 AI 能"看懂世界",目前已广泛应用于工业、安防、医疗、电商、交通等多个行业。
| 应用方向 | 场景 | 说明 |
|---|
| 图像分类 | 商品识别、动物识别、垃圾分类 | 图像内容打标签 |
| 目标检测 | 安防监控、人脸识别、车辆检测 | YOLO、Faster-RCNN |
| 图像分割 | 医疗图像(器官、肿瘤)、道路检测 | Pixel级识别,CV高精应用 |
| OCR | 发票识别、证件扫描、文本识别 | 实现图文转化 |
| 行为识别 | 店内轨迹分析、工地安全监测 | CV + 视频分析 |
| 图像生成 | AI画画、设计草图、插画创作 | Midjourney、DALL·E、SD |
| 图像搜索 | 以图搜图、电商找相似款 | 百度识图、淘宝识图 |
| 视频分析 | 安全监控、交通流量分析 | 动作、轨迹、人数统计等 |
| 应用方向 | 场景 | 说明 |
|---|
| 语音转文字 | 会议记录、采访整理、语音备忘 | 腾讯听听、小爱同学录音整理 |
| 语音搜索 | 智能遥控器、车载语音 | 语音搜索比键入更快捷 |
| 多语种识别 | 中英混说、会议翻译 | 支持全球多语言实时转写 |
| 通话分析 | 客服质检、情绪识别、关键字提取 | 呼叫中心语音挖掘 |
| 医疗记录 | 医生口述病历自动录入 | 提高诊室效率与准确性 |
| 应用方向 | 场景 | 说明 |
|---|
| 虚拟人配音 | 数字员工、短视频 AI 主播 | 阿里"云小蜜"、科大讯飞 TTS |
| 导航播报 | 车载语音、地图导航 | 高德地图语音合成 |
| 情感合成 | 不同语调、情绪的语音输出 | 模仿主播、明星语音 |
| 个性语音定制 | 模拟用户声音、训练私有音色 | 数字遗嘱、数字人声音克隆 |
| 阅读辅助 | 新闻朗读、有声书 | 喜马拉雅、讯飞有声合成平台 |
| 应用场景 | 涉及技术 | 说明 |
|---|
| 多模态问答 | CV + NLP | 看图问答(如文心一言、GPT-4o) |
| 视频字幕生成 | CV + ASR + NLP | 自动转字幕、翻译、多语合成 |
| 数字人 | TTS + NLP + CV | 虚拟形象对话、AI 主播、讲解员 |
| 智能会议助手 | ASR + NLP + Summarization | 自动会议纪要,关键词提取 |
| 智能驾驶舱 | CV + ASR + TTS | 人脸识别 + 语音交互 + 驾驶辅助 |
| 行业 | 典型 AI 应用 |
|---|
| 教育 | 语音评测、作文批改、智能讲题 |
| 医疗 | 影像识别、病例录入、医学 NLP |
| 金融 | 智能风控、客服机器人、报表生成 |
| 零售 | 图像识别收银、语音客服、广告创意生成 |
| 政务 | 智能问答、证件识别、舆情监测 |
| 安防 | 人脸布控、异常行为检测 |
| 交通 | 车流量分析、语音导航 |
| 内容创作 | 文案生成、AI 画图、视频剪辑 |