用AI大模型做舆情分析，效率提升80%的完整工作流：DeepSeek+乐思实战演示

Q: 用LLM做舆情分析，一个月的成本大概多少？

取决于内容量和模型选择。如果用DeepSeek分析100万条舆情，月成本约35万元。如果用本地开源模型，仅需承担服务器租赁成本5-10万元/月。

Q: LLM在舆情分析中会出现什么错误？

主要错误包括：讽刺识别不准、特定领域术语理解有偏差、多语言混合理解能力弱。这些可以通过Few-shot Prompt和微调改进。

Q: 自动生成的舆情报告准确吗？

自动生成的报告框架和数据准确率在90%以上，但建议人工审核后再发布，特别是涉及风险预警和应对建议的部分。

Q: LLM会学到我们的舆情数据吗？

正规LLM服务承诺不会使用客户数据训练。为最大保护隐私，建议对敏感信息脱敏，或使用本地开源模型。

📅 更新于 2026年3月 👤 作者：AI产品团队 ⏱️ 阅读时间：18分钟

AI大模型在舆情分析中的角色

2026年，大语言模型(LLM)已经成为舆情分析的核心驱动力。从GPT-4o、Claude、DeepSeek、百度文心(ERNIE)、阿里通义千问到讯飞星火，每一个主流LLM都能用于舆情分析，但各有优劣。

传统舆情分析 vs AI驱动分析

传统舆情分析流程依赖于规则引擎和统计模型，需要人工定义关键词库、规则集合，然后让系统自动匹配。这种方法的缺点是规则维护成本高，覆盖面有限，对中文的复杂表达(讽刺、夸张、暗示)的理解能力弱。

AI驱动的分析流程则不同。LLM通过深度学习和预训练，已经内化了语言的复杂规律，无需手工定义规则，就能理解文本的细微含义。例如，对于"这家医院的号源终于放出来了，但居然都是挂号费500块的专家号。真是'良心'啊"这句话，传统方法可能会识别为正面(出现了"良心"词汇)，而LLM能正确识别这是讽刺，判定为负面。

"AI大模型不仅仅是提升了舆情分析的准度，更重要的是解放了舆情分析师的大量机械性劳动，让他们能把更多精力投入到战略分析和应对建议。"

五步工作流完整设计

一个完整的AI驱动舆情分析工作流包含五个环节：

第一步：数据采集与预处理 —— 从乐思舆情监测平台或其他来源采集原始舆情数据，进行清洗和规范化。

第二步：批量情感分类 —— 使用LLM对采集到的内容进行大规模的情感分类(正面、中立、负面)、观点聚类。

第三步：话题聚类与趋势提取 —— 使用LLM识别核心话题、提取趋势信号、预测事件走向。

第四步：自动生成分析报告 —— 使用LLM的文本生成能力，将分析结果汇总成结构化的日报、周报或专题报告。

第五步：预警与决策支持 —— 根据分析结果，自动生成预警信号和应对建议。

第一步：数据采集与预处理

数据来源与格式

舆情分析的第一步是获取高质量的数据。乐思舆情监测平台每天采集超过1000万条网络内容，覆盖200+个数据源。通过API或者直接导出功能，可以将原始数据导入到LLM处理系统。

原始数据通常包含以下字段：内容文本、发表时间、发表平台、作者信息、转评赞数据。为了让LLM能够高效处理，需要进行数据清洗和格式规范化。

数据清洗与规范化

数据清洗包括：(1) 去除HTML标签、emoji、链接等无用信息；(2) 处理特殊符号和繁简体转换；(3) 去重(相同或高度相似的内容)；(4) 长度截断(LLM通常有token限制，如果超长则截断)。

💡 技巧：为了提高LLM的理解准度，可以将原始文本加上上下文信息，例如：[平台: 微博] [点赞: 2500] 用户评论："这家医院真的太坑了..."

第二步：批量情感分类

情感分类的提示词设计

LLM做情感分类，核心是设计好"提示词"(Prompt)。一个好的提示词应该包含：任务描述、分类标准、输出格式、少样本示例。

# 情感分类提示词示例
系统：你是一个舆情分析专家。你的任务是判断下面的文本表达的情感倾向。

分类标准：
- 正面：表达满意、赞美、感谢、积极评价
- 中立：表达事实陈述、疑问、中性讨论
- 负面：表达不满、批评、抱怨、负面评价

注意事项：
- 识别讽刺和反讽(特别是中文的"真是...啊"、"好家伙"等修辞)
- 考虑上下文和转评赞数据(高转评赞的负面评价权重更高)
- 医疗领域特殊词汇处理(手术并发症、感染等是中立词，但在患者评价中通常表达不满)

用户输入：{文本}

请按照以下JSON格式回复：
{
  "情感": "正面/中立/负面",
  "置信度": 0.85,
  "关键词": ["词1", "词2"],
  "原因": "简短说明判定理由"
}
            

批量处理与成本优化

对大批量舆情内容进行情感分类，使用LLM的Batch API或者异步调用可以大幅降低成本。例如，OpenAI的Batch API价格是实时API的50%。对于百万级别的舆情内容，成本差异可能超过50万元。

2026年，大多数舆情分析服务已经采用"白天实时分析、晚上批量分析"的双层架构，即：重要舆情实时调用LLM，普通舆情进行批处理。

第三步：话题聚类与趋势提取

自动话题聚类

一旦完成了单条内容的情感分类，下一步是将相关的内容聚类成"话题"或"事件"。例如，来自抖音、微博、知乎的十几条关于"某医院挂号费过高"的投诉，应该被聚类为一个话题。

LLM可以通过以下方式做话题聚类：(1) 先对每条内容提取关键信息和观点；(2) 根据共同的关键信息将内容分组；(3) 为每个分组生成话题标签和摘要。

案例：某医院"号源紧张"话题的自动聚类

2025年9月，某三甲医院号源持续紧张。在一个月内，舆情系统检测到超过500条相关内容，分散在微博、抖音、小红书等多个平台。通过LLM的话题聚类，这500条内容被自动聚类为3个子话题：(1) 号源放出困难(200条)；(2) 黄牛倒卖号源(180条)；(3) 挂号费过高(120条)。系统自动生成了各子话题的趋势分析：号源困难和黄牛倒卖呈上升趋势，需要警惕。医院基于这个分析，采取了增加号源放量、加强反黄牛措施等对策，成功遏制了舆情的进一步扩散。

趋势预测

基于话题的时间序列数据，LLM可以识别趋势模式，例如"话题热度在加速上升"或"话题即将进入衰减期"。结合话题的情感分布，系统可以判断这个趋势是正向还是负向，从而生成预警。

第四步：自动生成分析报告

日报生成

使用LLM生成舆情日报，可以将分析工作的效率提升10倍以上。一个日报通常包含：(1) 今日舆情概览(总量、正负比例)；(2) 核心话题列表(top5热点)；(3) 情感趋势图表；(4) 风险提示；(5) 应对建议。

通过设计好的提示词，LLM可以自动生成结构化、可读性强的日报文本。与人工编写相比，不仅速度快(5分钟 vs 2小时)，而且覆盖面更全，遗漏更少。

专题分析生成

对于突发的重大舆情事件，LLM可以快速生成专题分析报告，包括：事件时间轴、传播路径、情感演变、影响力评估、应对建议等。一份完整的专题报告可以在30分钟内自动生成。

⚠️ 注意：自动生成的报告需要人工审核。LLM有时会出现"幻觉"(生成不存在的信息)或逻辑矛盾。审核人员需要检查报告中的关键数据和观点是否与原始数据相符。

第五步：预警与决策支持

自动预警规则

基于话题热度、情感占比、传播速度等多个指标，可以定义自动预警规则。例如：

· 负面话题热度环比增长>50% → 黄色预警(关注)

· 单日新增负面内容>500条 → 橙色预警(应对)

· 话题涉及生命安全/法律问题 → 红色预警(紧急应对)

预警不仅是简单的"发出警报"，而是要通过LLM生成"应对建议"。例如，对于一条涉及医疗事故的投诉，系统可以自动生成建议："该事件涉及患者伤害，属于高风险。建议：1) 立即启动应急预案；2) 成立调查小组；3) 准备官方回应草稿；4) 监测舆情动态；5) 准备配合媒体采访。"

决策支持系统

除了自动预警，LLM还可以充当"决策顾问"的角色。管理员可以向系统提问：

· "对于这条关于医患纠纷的投诉，应该采取删帖还是回应？"

· "这次舆情事件的风险等级如何？可能造成什么后果？"

· "参考过去的类似案例，我们应该采取什么对策？"

LLM会根据事件信息、历史案例、行业经验生成专业的决策建议。

模型选择对比与成本分析

主流LLM对比

GPT-4o (OpenAI)：最强大的通用LLM，在舆情分析中的表现最佳(准度95%+)。缺点是价格昂贵(API调用0.06元/千token)，且存在数据隐私风险(可能被用于训练)。适合对准度要求极高的企业。

DeepSeek-V3 (深度求索)：2025年新推出的国产大模型，性能接近GPT-4o，但价格仅为1/3。API调用价格约0.02元/千token。对中文的理解能力强，讽刺识别准度高。数据存储在国内，隐私风险低。是舆情分析的最优选择。

百度文心ERNIE (4.0)：国产模型，API调用价格0.025元/千token。与DeepSeek相比，在实体识别和关系抽取上更强。对多轮对话的理解能力更好。

Claude-3 (Anthropic)：通用能力很强，但对中文的理解不如GPT-4o。成本较高。不推荐用于中文舆情分析。

成本计算示例

假设一个企业需要分析100万条舆情内容，平均每条200个token，全年成本对比：

· GPT-4o：100万 × 200 × 0.06 = 1200万元

· DeepSeek-V3：100万 × 200 × 0.02 = 400万元

· 百度ERNIE：100万 × 200 × 0.025 = 500万元

选择DeepSeek可以比GPT-4o节省800万元，同时准度只略低2-3%。这是一个非常划算的trade-off。

GPT-4o

准度最高，价格最贵，隐私风险。适合金融、政府。

DeepSeek-V3

准度高，价格便宜，隐私安全。最佳舆情选择。

文心ERNIE

中文理解强，实体识别优，价格中等。不错选择。

数据隐私与安全考量

云端调用 vs 本地部署

使用云端LLM(如OpenAI API)的优点是无需本地计算资源，可以立即使用。缺点是数据会上传到第三方服务器，存在隐私风险。对于涉及企业机密或用户隐私的舆情数据，建议使用本地部署的开源模型(如Llama、Mistral、Qwen等)。

国内的大模型(如DeepSeek、文心ERNIE)虽然也是云端调用，但由于数据存储在国内，符合《数据安全法》和《个人信息保护法》，隐私风险相对较低。

敏感信息脱敏

在提交舆情文本给LLM分析之前，应该对敏感信息进行脱敏处理。包括：(1) 患者姓名和身份证号 → 替换为"患者A"；(2) 医生姓名 → 替换为"医生B"；(3) 医院地址和联系方式 → 替换为通用表述。

💡 建议：采用"LLM分析 + 本地存储"的混合架构。使用脱敏后的文本调用云端LLM做分析，分析结果存储在企业本地，确保既能享受LLM的强大能力，又能保护隐私。

❓ 常见问题解答

Q: 用LLM做舆情分析，一个月的成本大概多少？

A: 取决于内容量和模型选择。如果用DeepSeek分析100万条舆情(平均200 token)，月成本约35万元。如果用免费的开源模型(如Llama)本地部署，仅需承担计算资源成本(服务器/GPU租赁约5-10万元/月)。

Q: LLM在舆情分析中会出现什么错误？

A: 主要错误包括：1) 讽刺识别不准；2) 对特定领域术语理解有偏差(如医学术语)；3) 对多语言混合(英文+中文)的理解能力弱；4) 对极端观点的判定有偏差。这些问题可以通过Few-shot Prompt(少样本提示)和微调来改进。

Q: 自动生成的舆情报告准确吗？能直接用吗？

A: 自动生成的报告框架和数据准确率在90%以上，但建议人工审核后再发布。特别是对于涉及风险预警和应对建议的部分，一定要经过专业人员的检查和补充。

Q: LLM会学到我们的舆情数据吗？

A: 正规的云端LLM服务(如OpenAI、DeepSeek官方API)承诺不会使用客户数据来训练模型。但为了最大程度保护隐私，还是建议对敏感信息脱敏，或者使用本地部署的开源模型。

准备用AI升级你的舆情分析工作流了吗？

乐思舆情已经完全集成DeepSeek等主流LLM，提供开箱即用的AI舆情分析能力。无需自己搭建架构，无需自己调用API，只需登录乐思平台，就能享受80%效率提升带来的便利。

乐思舆情监测SaaS服务 →