数据发现与数据目录平台实践(2025) 数据发现与数据目录平台实践(2025)数据目录让数据资产可见可用。本文从模型、搜索与治理展开。一、模型与采集元数据模型:覆盖数据集、字段、任务与责任人。采集:在 ETL、流处理与查询层自动采集与更新。二、搜索与标签搜索:按名称、字段与标签与血缘进行检索。标签:统一标签体系与权限,支持业务域分类。三、 数据科学与AI 2026年02月13日 0 点赞 0 评论 15 浏览
数据契约Data Contracts:生产与消费的责任边界 以数据契约明确生产与消费的责任边界,定义模式、SLA 与质量断言,降低回归与耦合。 数据科学与AI 2026年02月13日 0 点赞 0 评论 15 浏览
数据接入工具对比:Airbyte与Kafka Connect 比较两大数据接入工具在生态、增量能力与部署模型上的差异,指导数据集成选型。 数据科学与AI 2026年02月13日 0 点赞 0 评论 15 浏览
浏览器端敏感数据存储治理(IndexedDB/LocalStorage/加密与清理)最佳实践 通过浏览器端AES-GCM加密存储与TTL清理、最小化数据驻留,降低敏感信息泄露风险并提升可控性。 数据科学与AI 2026年02月13日 0 点赞 0 评论 15 浏览
湖仓一体数据治理实践(2025) 湖仓一体数据治理实践(2025)湖仓一体结合数据湖的灵活性与数仓的治理能力。本文聚焦表格式选型、数据一致性与治理方法。一、表格式与兼容Iceberg/Delta Lake:提供表级元数据、快照与 ACID 语义。计算引擎:兼容 Spark、Flink、Trino 等主流生态。分区与索引:合理的分区策 数据科学与AI 2026年02月13日 0 点赞 0 评论 15 浏览
省流信号:Save-Data 与降低资源开销的策略 "解释 Save-Data 请求头与数据节省偏好在浏览器与代理中的意义,给出在图片/脚本/动画上的降级策略与服务端适配方法。" 数据科学与AI 2026年02月13日 0 点赞 0 评论 15 浏览
TensorRT-8.x特性综述 技术摘要TensorRT 8.x 通过图优化、算子融合与内核调度提升 GPU 推理效率;在 FP32 与混合精度路径中兼顾性能与精度,并在 CUDA 生态下优化主机-设备数据管线。对延迟敏感的在线推理场景,配合批次与并发策略,显著提升整体吞吐。技术参数图优化:层融合、内核合并、内存复用(数据来源:T 数据科学与AI 2026年02月14日 0 点赞 0 评论 14 浏览
LLM 服务端流式传输与断点续传(SSE/WebSocket、分片与验证) 使用SSE或WebSocket提供LLM流式输出,并通过分片与游标实现断点续传与重试安全,给出服务端与客户端实现与验证方法。 数据科学与AI 2026年02月13日 0 点赞 0 评论 14 浏览
RAG评估指标:Faithfulness与Answer Relevance 通过忠实度与答案相关性指标评估 RAG 系统质量,结合上下文覆盖与召回构建可运行的评测体系。 数据科学与AI 2026年02月13日 0 点赞 0 评论 14 浏览