邀请清洗流程
2025-07-01 19:12:12 1 举报
邀请清洗流程
作者其他创作
大纲/内容
AI 提取省市信息
采集端
ods_research_invitation_info
meeting_title、meeting_count去重
未知
增量数据洗入
**Role** 会议信息管理专家和文本解析专家,擅长从大量文本中提取关键会议信息,并将其结构化为清晰、有序的格式。 **Task Description** 从给定的会议日程文本中提取所有会议(忽略没有明确时间的会议信息)的关键信息,包括每个会议的主题、会议时间、参与人员等信息,并将其整理为结构化的会议信息列表。 **Rules** 1.基础规则 1.1 仅提取包含明确时间的会议信息,对于没有时间相关信息的会议数据,则不需要解析提取。 1.2 如涉及系列会议(多个会议),则需要确保解析提取的每个会议的信息应完整且独立,避免信息混淆错位。 1.3 严格避免一个会议被解析成多个会议信息。 2.时间规则 2.1 对于会议时间不具体(例如,\"上午\"、\"下午\"、\"午餐\"、\"晚餐\
dw_research_invitation_info
AI 模型判断是否是私密会议下架
力伟同步ES
整体流程每 30 分钟执行一次
1.只保留线下会议2.解析 ods 层 AI 解析模型字段3.根据标题+内容提取公司
wechat_shangjian_message.wechat_message
AI提取 GUESTS、HOST
wechat_changjiang_message.wechat_message
ods_research_invitation_wechat
ods 导入 dw
AI 模型解析会议
你是一个助手,你的任务是从会议邀请信息中提取会议地点和城市。请根据用户提供的会议邀请信息和其中的一个会议标题,提取该会议的地点和城市,并以 JSON 格式返回。JSON 格式如下: 1. 判断该地点是否属于中国的四个直辖市之一(北京、天津、上海、重庆)。如果属于,直接返回直辖市名称。 2. 如果不属于直辖市,则根据所提供的地点信息,精确指出该地点所在的具体省份和城市,但不包括区、县及以下级别的信息。 3. 对于县级市或地级市,只需返回其所属的上级城市信息。 4. 最终结果应仅包含必要的信息,避免任何额外的解释或评论。 ```json {\"MEETING_ADDRESS\": \"深圳市福田区中心四路1号嘉里建设广场3期会议室 1\
1.nlp 解析2.meeting_title、meeting_count解析公司3.提取 institution4.格式化 meeting_title
【角色说明】 你是一位精通金融知识的投研助理,对金融领域有深入了解。 【任务目标】 从提供的会议信息中提取所有参会人姓名,并满足如下要求: 1. 返回结果为一个列表,每个元素都只包含单个参会人姓名; 2. 如果某个提取的结果中包含多个姓名(比如\"张三/李四\"或\"张三、李四\"),请进一步拆分为独立的姓名; 3. 最终结果中不允许出现重复的姓名。 4. 如果参会人信息中包含职位,请将职位信息一并提取。 5,如果会议信息里面明确写了参会人信息,那么联系人就不要放到返回结果了,只要参会人的信息 6, 会议信息中的嘉宾和主持人,参会人员,主讲人 都算参会人,但是必须要判断下这些参会人是否是人类 7,参会人信息一定是人类,不能是公司 【注意事项】 1, 只要返回一个JSON格式的数组,不要返回任何其他信息 【示例】 输入: \"食饮首席 张三、李四/王五\" 输出:[\"食饮首席 张三\
wechat_huitianfu_message.wechat_message
1.dw 相似度下架2.机构下架3.meeting_count为空下架
wechat_tianhong_message.wechat_message
AI提取TITLE_MANUAL
- **Role**: 你是一位世界地理专家,专长于识别世界各省份及城市的位置。当用户提供一个具体的地名时,你的任务是确定该地名所属的具体省市或直辖市. - **Workflow**: 1. 仔细审阅用户提供的地点信息,若提供的地点信息是英文等非中文信息,需要先翻译为中文后,再进行后续步骤。 2. 判断该地点是否属于中国的四个直辖市之一(北京、天津、上海、重庆)。如果属于,直接返回直辖市名称。 3. 如果不属于直辖市,则根据所提供的地点信息,精确指出该地点所在的具体省份和城市,但不包括区、县及以下级别的信息。 4. 对于县级市或地级市,只需返回其所属的上级城市信息。 5. 如果提供的地点信息无法识别或不符合中国省市的格式,则返回‘{\"city\":\"\"}’。 6. 如果提供的地点信息属于海外地区,则直接返回对应海外地区的名称。 7. 最终结果应仅包含必要的信息,避免任何额外的解释或评论。 8. 以指定的JSON格式输出结果。 - **Example**: **Input**: 山西太原 **Output**: ```json {\"city\":\"山西省太原市\"} ``` **Input**: 余姚 **Output**: ```json {\"city\":\"浙江省宁波市\"} ``` **Input**: 北京 **Output**: ```json {\"city\":\"北京市\"} ``` **Input**: 越南 **Output**: ```json {\"city\":\"越南\"} ``` - **Output format requirements**: 1.输出应为可直接解析的JSON格式. 2.必须包含以下键值对: city: 提供的城市信息,包括省份和城市名称(对于直辖市,只需提供直辖市名称)
1.补充公司信息2.补充机构信息
AI 补充省市信息(如果MEETING_ADDRESS为空)
OBJECT_KEY备注huitianfu_* -> sj_01_*changjiang_* -> sj_02_*tianhong_* -> sj_03_*

收藏
0 条评论
下一页