我们收集的数据
账户数据:姓名、电子邮件地址、语言偏好、密码哈希(在使用邮箱/密码注册时)、身份提供方标识(如 Google、Apple、GitHub)、订阅层级、推荐码,以及登录时间、IP 地址、浏览器、操作系统和根据 IP 推测的大致地理区域等安全事件。
工作空间数据:聊天消息与提示词、上传的文件(PDF、图片、Excel、纯文本)、分子草图、绘制的结构(SMILES/InChI)、已保存的报告草稿、学习会话、闪卡、测验记录、错题历史,以及从开放学术 API 获取的参考文献和您选择生成的导出文件。
文件与向量嵌入:当您上传文件时,其二进制内容会保存在我们的私有对象存储桶中,并被解析为文本与图像分块。我们计算向量嵌入(1024 维,BGE-M3,在我们位于德国的自有服务器上生成),以便该文件可被用于您日后提问时的检索。化学图像还可能由本地部署的 DECIMER 模型处理以提取 SMILES。
使用与遥测数据:每个模型消耗的额度、排队延迟、模型标识、错误码、功能交互、页面浏览、网页核心指标以及防滥用信号。部分遥测数据通过 Vercel Analytics、Firebase Analytics 以及在启用时由自建错误监控系统收集。
支付元数据:订阅状态、套餐、发票、税务区域、Stripe 颁发的客户标识,以及 Stripe 回传的有限卡片元数据,例如卡组织和卡号后四位。我们绝不存储完整卡号、CVC 或银行凭据。
通信数据:客户支持工单与回复、自愿提供的营销偏好、事务性邮件的语言偏好。