sii_hybrid_search - 混合搜索
概述
sii_hybrid_search 工具执行智能混合搜索,结合 SII 后端的网络搜索和认知库搜索。使用不同的查询策略:网络搜索使用自然语言,认知搜索使用关键词。具有高级相关性评分、全面的过滤选项和智能结果合并功能。
工具名称
- 内部名称:
sii_hybrid_search - 显示名称: SII Hybrid Search
- 图标: 搜索 (Search)
前置条件
使用此工具需要:
- SII 账户:需要有效的 SII 账户
- 环境变量:
SII_USERNAME: SII 用户名SII_PASSWORD: SII 密码SII_BASE_URL: SII 后端 URL(可选)
参数
可选参数(至少需要一个查询)
| 参数名 | 类型 | 默认值 | 说明 |
|---|---|---|---|
web_query | string | - | 网络搜索的自然语言查询(例如:"最新人工智能发展")。使用描述性、对话式语言。如果不提供,将跳过网络搜索。 |
cognition_query | string | - | 认知搜索的空格分隔关键词(例如:"人工智能 发展 趋势")。使用特定关键词,用空格分隔。如果不提供,将跳过认知搜索。 |
max_web_results | number | 5 | 获取的最大网络搜索结果数(最大:10) |
max_cognition_results | number | 10 | 获取的最大认知结果数(最大:20) |
result_limit | number | 15 | 返回的最终合并结果的最大数量(最大:30) |
cognition_sort | string | "hot" | 认知的排序方法:"latest"(最新)、"hot"(热门)、"most_liked"(最多点赞) |
cognition_time_filter | string | "all" | 认知的时间过滤:"day"(一天)、"week"(一周)、"month"(一月)、"all"(全部) |
cognition_topics | string[] | - | 按主题过滤认知(例如:["AI", "Technology"]) |
cognition_source_filter | string | - | 认知的来源过滤(例如:"arxiv"、"reddit"、"twitter") |
cognition_author_filter | string | - | 认知的作者过滤 |
功能说明
双重搜索:
- 网络搜索:获取最新在线信息
- 认知搜索:访问结构化知识库
- 智能合并结果
高级相关性评分:
- 基于内容相关性
- 考虑来源多样性
- 智能排序算法
全面过滤:
- 时间范围过滤
- 主题分类过滤
- 来源和作者过滤
结果合并:
- 去重处理
- 相关性排序
- 来源多样性平衡
使用场景
- 需要同时获取网络和知识库信息
- 研究特定主题的全面信息
- 比较不同来源的观点
- 获取最新和历史信息的结合
使用示例
基本混合搜索
json
{
"web_query": "最新人工智能发展",
"cognition_query": "人工智能 发展 趋势"
}仅网络搜索
json
{
"web_query": "2024年科技新闻",
"max_web_results": 10
}仅认知搜索
json
{
"cognition_query": "机器学习 算法 应用",
"cognition_sort": "most_liked",
"cognition_time_filter": "month"
}高级过滤搜索
json
{
"web_query": "深度学习最新研究",
"cognition_query": "深度学习 神经网络",
"cognition_topics": ["AI", "Machine Learning"],
"cognition_source_filter": "arxiv",
"cognition_time_filter": "week",
"result_limit": 20
}特定作者搜索
json
{
"cognition_query": "transformer 架构",
"cognition_author_filter": "research_team",
"cognition_sort": "latest"
}返回结果
工具返回一个包含以下字段的对象:
llmContent: 格式化的搜索结果returnDisplay: 用户友好的显示信息summary: 操作摘要results: 合并后的结果数组
结果格式
每个结果包含:
typescript
{
title: string; // 标题
content: string; // 内容摘要
source: string; // 来源(web 或 cognition)
url?: string; // URL(如果有)
relevance_score: number; // 相关性分数
metadata?: object; // 额外元数据
}搜索策略
网络搜索查询
使用自然语言,描述性表达:
- ✅ "人工智能在医疗领域的最新应用"
- ✅ "如何使用 React Hooks 管理状态"
- ❌ "AI 医疗"(过于简短)
认知搜索查询
使用关键词,空格分隔:
- ✅ "人工智能 医疗 应用 案例"
- ✅ "React Hooks 状态管理"
- ❌ "如何使用 React Hooks"(过于口语化)
最佳实践
组合使用两种搜索:
- 获得更全面的结果
- 平衡最新性和深度
针对性查询:
- 网络搜索:使用完整句子
- 认知搜索:使用精确关键词
合理设置结果数量:
- 一般任务:5-10 个结果
- 深度研究:15-20 个结果
使用过滤器:
- 时间过滤:获取最新信息
- 主题过滤:聚焦特定领域
- 来源过滤:获取权威信息
检查结果质量:
- 查看相关性分数
- 验证来源可靠性
- 交叉验证信息
性能考虑
搜索时间:
- 单一搜索:1-2 秒
- 混合搜索:2-4 秒
- 取决于结果数量
结果质量:
- 更多结果 ≠ 更好质量
- 关注相关性分数
- 使用过滤器提高精确度
API 限制:
- 注意调用频率
- 合理设置结果数量
- 避免过度请求
错误处理
可能的错误情况:
认证错误:
- 缺少 SII 凭据
- 认证失败
查询错误:
- 两个查询都为空
- 查询格式不正确
网络错误:
- 连接失败
- 超时
结果错误:
- 没有找到结果
- 结果格式错误
与其他工具的集成
与 sii_web_fetch 结合
1. 使用 sii_hybrid_search 找到相关内容
2. 使用 sii_web_fetch 获取详细信息与 sii_deep_research 结合
1. 使用 sii_hybrid_search 进行初步搜索
2. 使用 sii_deep_research 进行深度研究与 sii_cognition_extract_upload 结合
1. 使用 sii_hybrid_search 找到有价值的内容
2. 使用 sii_cognition_extract_upload 保存到知识库相关工具
sii_web_search: 纯网络搜索sii_cognitions: 纯认知库搜索sii_web_fetch: 获取网页内容sii_deep_research: 深度研究
总结
sii_hybrid_search 是一个强大的搜索工具,结合了网络搜索的实时性和认知库的深度。通过合理使用查询策略和过滤选项,可以获得高质量、全面的搜索结果。
记住:针对不同的搜索源使用不同的查询策略,并利用过滤器提高结果的相关性和质量。
