132 lines
3.5 KiB
JavaScript
132 lines
3.5 KiB
JavaScript
// src/utils/citationUtils.js
|
|
// 引用数据处理工具
|
|
|
|
/**
|
|
* 处理后端返回的引用数据
|
|
*
|
|
* @param {Object} rawData - 后端返回的原始数据
|
|
* @param {Array} rawData.data - 引用数据数组
|
|
* @returns {Object|null} 处理后的数据结构,包含 segments 和 citations
|
|
*
|
|
* @example
|
|
* 输入格式:
|
|
* {
|
|
* data: [
|
|
* {
|
|
* author: "陈彤",
|
|
* sentences: "核心结论:...",
|
|
* query_part: "国内领先的IT解决方案提供商",
|
|
* match_score: "好",
|
|
* declare_date: "2025-04-17T00:00:00",
|
|
* report_title: "深度布局..."
|
|
* }
|
|
* ]
|
|
* }
|
|
*
|
|
* 输出格式:
|
|
* {
|
|
* segments: [
|
|
* { text: "核心结论:...", citationId: 1 }
|
|
* ],
|
|
* citations: {
|
|
* 1: {
|
|
* author: "陈彤",
|
|
* report_title: "深度布局...",
|
|
* declare_date: "2025-04-17",
|
|
* sentences: "核心结论:..."
|
|
* }
|
|
* }
|
|
* }
|
|
*/
|
|
export const processCitationData = (rawData) => {
|
|
// 验证输入数据
|
|
if (!rawData || !rawData.data || !Array.isArray(rawData.data)) {
|
|
console.warn('citationUtils: Invalid data format, expected { data: [...] }');
|
|
return null;
|
|
}
|
|
|
|
if (rawData.data.length === 0) {
|
|
console.warn('citationUtils: Empty data array');
|
|
return null;
|
|
}
|
|
|
|
const segments = [];
|
|
const citations = {};
|
|
|
|
// 处理每个引用数据项
|
|
rawData.data.forEach((item, index) => {
|
|
// 验证必需字段
|
|
if (!item.sentences) {
|
|
console.warn(`citationUtils: Missing 'sentences' field in item ${index}`);
|
|
return;
|
|
}
|
|
|
|
const citationId = index + 1; // 引用 ID 从 1 开始
|
|
|
|
// 构建文本片段
|
|
segments.push({
|
|
text: item.sentences,
|
|
citationId: citationId
|
|
});
|
|
|
|
// 构建引用信息映射
|
|
citations[citationId] = {
|
|
author: item.author || '未知作者',
|
|
report_title: item.report_title || '未知报告',
|
|
declare_date: formatDate(item.declare_date),
|
|
sentences: item.sentences,
|
|
// 保留原始数据以备扩展
|
|
query_part: item.query_part,
|
|
match_score: item.match_score
|
|
};
|
|
});
|
|
|
|
// 如果没有有效的片段,返回 null
|
|
if (segments.length === 0) {
|
|
console.warn('citationUtils: No valid segments found');
|
|
return null;
|
|
}
|
|
|
|
return {
|
|
segments,
|
|
citations
|
|
};
|
|
};
|
|
|
|
/**
|
|
* 格式化日期
|
|
* @param {string} dateStr - ISO 格式日期字符串
|
|
* @returns {string} 格式化后的日期 YYYY-MM-DD
|
|
*/
|
|
const formatDate = (dateStr) => {
|
|
if (!dateStr) return '--';
|
|
|
|
try {
|
|
const date = new Date(dateStr);
|
|
if (isNaN(date.getTime())) return '--';
|
|
|
|
const year = date.getFullYear();
|
|
const month = String(date.getMonth() + 1).padStart(2, '0');
|
|
const day = String(date.getDate()).padStart(2, '0');
|
|
|
|
return `${year}-${month}-${day}`;
|
|
} catch (e) {
|
|
console.warn('citationUtils: Date formatting error:', e);
|
|
return '--';
|
|
}
|
|
};
|
|
|
|
/**
|
|
* 验证引用数据格式是否有效
|
|
* @param {Object} data - 待验证的数据
|
|
* @returns {boolean} 是否有效
|
|
*/
|
|
export const isValidCitationData = (data) => {
|
|
if (!data || typeof data !== 'object') return false;
|
|
if (!data.data || !Array.isArray(data.data)) return false;
|
|
if (data.data.length === 0) return false;
|
|
|
|
// 检查至少有一个有效的 sentences 字段
|
|
return data.data.some(item => item && item.sentences);
|
|
};
|