Viking 长期记忆是什么
Viking长期记忆是火山引擎推出的端到端长期记忆标准产品,基于自研VikingDB向量数据库,具备百亿级数据毫秒级检索能力,能精准抽取事件与用户画像,支持语义与关键词混合检索及时序处理,整体性能优于行业平均水平。产品提供记忆模板+自定义双模式抽取策略,满足多样化业务需求,广泛应用在社交陪聊、客服、教育陪练等场景,为AI应用构建持久记忆体,提升交互体验。
Viking 长期记忆的主要功能
- 记忆抽取与检索:精准抽取事件和用户画像,支持语义与关键词混合检索,实现毫秒级响应,确保记忆的准确性和高效性。
- 记忆生命周期管理:稳定记录与检索对话历史,具备时序处理能力,实现跨会话记忆延续和角色隔离,让记忆随时间沉淀高价值洞察。
- 个性化交互支持:基于用户画像与行为历史,提供个性化交互支持,满足不同用户和场景下的记忆需求,提升用户体验。
- 高性能与高并发支持:支持百亿级数据毫秒级检索,索引更新秒级完成,满足高并发、低延迟业务场景。
- 灵活适配与自定义能力:提供“记忆模板 + 自定义”双模式记忆抽取策略,支持自定义画像能力,灵活适配不同业务需求。
- 智能关联:自动发现信息关联,构建动态记忆网络,通过多模态融合和知识图谱技术,实现信息的智能关联。
- 持续学习:根据使用习惯优化记忆结构,通过用户行为分析和自适应学习,让系统越用越懂用户。
如何使用Viking 长期记忆
- 开通记忆库:访问Viking长期记忆官网 https://console.volcengine.com/vikingdb/memory/region:vdb-memory+cn-beijing/first-use,登录火山引擎账号开通记忆库。
- 创建记忆库:在记忆库控制台,或直接调用
collection/create
接口,创建一个记忆库。 - 写入原始数据:调用
session/add
接口,向已创建的记忆库写入 session 数据。系统将根据记忆库的配置(事件类型、实体类型、抽取配置)对消息进行处理和存储,形成结构化的记忆事件。注意:- 调用
add_session
接口时,若使用相同的session_id
,会覆盖该会话下已有的用户画像和事件。建议使用 UUID 动态生成session_id
,确保每次会话独立;只有在确实需要覆盖时才重复使用。 - 只有在
messages
中同时传入user
和assistant
的消息时,画像和事件才会正确归属用户。接口不会仅依赖metadata
中的 ID 进行关联;如果只传user
消息,事件不会关联到metadata
中的assistant
。
- 调用
- 查看记忆:在控制台查看刚刚写入的数据抽取出的记忆,包括用户列表、画像记忆和事件记忆。
- 检索记忆:完成原始数据写入后,在控制台上先进行记忆检索的测试。为减少不必要的费用,记忆库默认在有数据写入时才开始创建索引,索引构建大约需要 3 – 5 分钟,建议在写入数据后,等待一段时间再进行检索。
- 生产环境集成: 调用
memory/search
接口进行检索。 - 检索事件:
user_id
和assistant_id
至少填写一个,也可以同时填写。建议每轮对话都进行检索。 - 检索画像:只能填写
user_id
或assistant_id
,且二者不能同时填写。检索只在会话开始时检索一次。
Viking 长期记忆的应用场景
- 客服场景:通过跨会话记忆,客服系统能记住用户之前的问题和解决方案,避免用户重复描述问题,提升客服效率和用户体验。
- 教育场景:记录学生的学习进度、知识点掌握情况和学习习惯,实现“因材施教”,提供个性化的学习建议和辅导内容。
- 智能硬件场景:智能硬件设备根据用户的使用习惯和偏好,提供个性化的功能和服务,不断学习用户的行为模式,优化自身功能。
- 社交陪聊场景:陪聊应用能记住之前的对话内容,保持对话的连贯性和一致性,通过分析用户的情感和兴趣点,提供更贴心的陪伴和建议。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。