之江实验室大规模语料检索引擎技术服务-之江实验室-政府采购意向

之江实验室大规模语料检索引擎技术服务-之江实验室-政府采购意向

发布于 2025-04-12

招标详情

之江实验室
联系人联系人294个

立即查看

可引荐人脉可引荐人脉567人

立即引荐

历史招中标信息历史招中标信息12111条

立即监控

项目编号 - 资质要求 -
招标/采购内容 大规模语料检索引擎技术服务 预算金额 220.00万元
获取标书截止时间 - 投标截止时间 -
招标单位 招标联系人/电话
- 招标单位其他联系人>

为便于供应商及时了解采购信息,现将****点击查看大规模语料检索引擎技术服务采购意向公开如下:

采购单位

****点击查看

采购项目名称

****点击查看大规模语料检索引擎技术服务

采购品目

服务

采购需求概况

服务内容如下:

1. 基础架构要求
ES集群能力
(1) 需基于Elasticsearch 8.x+构建,支持动态扩展至64个节点
(2) 单集群承载能力≥5亿文档
(3) 索引设计需包含分片策略、冷热数据分离方案
(4) 要求基准测试:1亿数据全量索引时间≤12小时(指定硬件配置)
(5) 支持缓存服务
2. 智能搜索核心模块
2.1 NLP处理层
(1) 必须集成Embedding模型,提供语义向量化能力
(2) 支持多语言分词(至少中/英)
(3) 具备查询改写能力
2.2 混合搜索能力
(1) 融合传统BM25与向量搜索(kNN search)
(2) 支持多维度排序:相关度、时效性、权威性加权
(3) 需实现Learning to Rank机制,提供训练接口
3. 数据处理体系
数据管道
(1) 实时数据处理:支持Flink/Spark流式接入
(2) 异构数据转换:PDF/HTML文档统一解析Markdown格式。
4. 性能及效果指标
(1) 复杂查询响应时间:95%请求≤1s
(2) 高并发能力:支持≥50 QPS持续吞吐
(3) 效果指标:
① 用户意图理解准确率>=0.95
② 前 20 个结果准确率达到80%
(4) 数据处理的去重精度:基于SimHash的重复内容识别率≥99.9%
5. 运维监控要求
5.1 可观测性
(1) 全链路日志追踪(从接收到结果返回)
(2) 异常检测:自动识别慢查询/**热点
5.2 安全合规
(1) 查询日志保留
(2) 支持数据更新、删除
6. 其他要求
至少安排原厂3人驻场负责系统搭建,算法调优和数据处理工作并完成与之江的工作交接

预算金额(万元)

220

预计采购时间

****点击查看

中小企业预留情况

/

落实政府采购政策功能情况

/

联系人

/

联系电话

/

备注

/

关键词