[FEATURE] 实际落地易用性提升
SQLBot 版本 v1.0.0
请描述您的需求或改进建议
数据不可见、问题不明确是影响查询结果的主要因素。
-
从实际应用角度来看,开发阶段需要优先构建好元数据,理清表之间的关系。虽然现有功能在构建元数据方面没有问题,但表关系不够直观。
- 建议:是否可以提供一个可视化的表关系构建标签(label),让用户能够更直观地建立和查看表之间的关联关系?
- 同时考虑加入字段字典维护功能,因为在很多场景下,字段本身就是检索的重要维度。
需要一个类似以下的维护关系的可视化界面:
-
是否可以新增针对数据集的内置问题?
- 新增内置问题,应针对已知数据集设计,确保能够准确映射到具体数据。
- 可以采用内置推荐机制,或者提供选项供用户选择,帮助用户快速定位常见问题。
思考灵感来源:用户使用系统是有使用习惯的,完全未知领域随意提问的情况毕竟是少数。SQLBot是构建在特定数据源之上的,因此面对的不是完全未知的场景。针对某个固定的数据源,用户能询问的内容实际上是相对固定的。用户不会逐一尝试各种问题,而是会重复询问类似的问题,例如"xxx趋势"、"xxx最新情况"等。SQLBot应该能够针对特定数据库,除了动态生成数据查询功能外,还能通过积累用户使用经验变得越来越好用,真正解决用户的问题。
查询结果不准确,一方面是由于用户的问题一般情况下可能是由于有一些行业术语之类的,通用的llm并不会了解一些行数术语,另一方面用户会默认一些查询条件在他的自然语言中,这个就需要了解用户习惯,积累一些语义等等,然后当db schema越来越大,有些表结构也越来越复杂的情况下,需要过滤db schema来帮助llm提高准确性,这个就需要对初始的db schema做优化,类似chartdb可以定义字段级别的描述解释,或者专门构建让llm可以使用的view等等。
texttosql最难的是准确性,不像一般的文本生成、翻译、润色等等,可以不是那么准确,最不济多轮对话能够准确也行,否则落地上production环境还是很难。
感谢您的反馈,我们需要先讨论一下。
感谢您的反馈,我们先加入需求池并进行调研。
比如像 deepasking.cn 这个应用它就有【获取表结构】【查看表结构】的功能以及表之间的外键关系,这个对大模型生成稳定可靠的sql极其重要