Chatbot 向非专家开放计算化学
        Advanced 计算软件通过自动化运行分子模拟的许多过程来简化量子化学研究。 然而,这些软件包的复杂设计往往限制了它们在受过专业计算技术培训的理论化学家的使用。

         埃默里大学开发的新 Web 平台通过用户友好的聊天机器人克服了这一限制。

         聊天机器人指导非专家完成设置分子的多步骤过程模拟和可视化溶液中的分子。 它使任何化学家(包括化学专业的本科生)都可以通过聊天来配置和执行复杂的量子力学模拟。

         这个免费的、公开可用的平台 -- 称为 AutoSolvateWeb -- 主要在云基础设施上运行,进一步扩展了对复杂计算研究工具的访问。

         杂志《化学科学》发表了 AutoSolvateWeb 的概念验证,这标志着在将 AI 融入教育和科学研究方面向前迈进。

         AutoSolvateWeb 旨在为要溶解的特定化学品(溶质)和要溶解的物质(溶剂)设置模拟,从而产生溶液(溶剂化物)。

        :模拟以 3D 电影的形式提供。

         “它有点像显微镜,让你从原子水平的角度了解溶液中相互作用的分子,”埃默里大学化学助理教授 Fang Liu 说。领导了 AutoSolvateWeb 的开发。

         AutoSolvateWeb 的广泛可访问性使其成为创建大型、高质量数据集的宝贵工具,用于解决溶液中分子的行为。 此类数据集为应用机器学习技术来推动从可再生能源到人类健康等各个领域的创新奠定了基础。

         “我们的目标是帮助加快科学发现,”化学科学论文的合著者、埃默里大学博士生 Ffanning 任 说化学。

         Rohit Gadde 是前埃默里大学研究专家,是该论文的第一作者。 其他合著者包括埃默里大学化学研究生 Lechen Dong; Yao Wang,埃默里大学化学助理教授; 前埃默里大学访问学者 Sreelaya Devaguptam; 以及克莱姆森大学(Clemson University)前研究生研究助理拉贾特·米塔尔(Rajat Mittal)。

         自动化复杂任务

         作为一名理论化学家,Liu 领导着一个专门从事计算化学的团队,包括建模和破译溶液相中的分子性质和反应。

        :在对溶液中的分子运行量子化学程序之前,有必要通过分子模拟确定溶质分子的几何形状以及周围溶剂分子的位置和方向。 设置和运行这些模拟的过程既复杂又耗时,限制了研究人员执行此类计算的频率。

         2022 年,刘氏集团开发了一种使用称为 AutoSolvate 的系统自动执行其中许多计算的方法。 该系统将计算化学家进入超级计算机运行模拟所需的代码行数从数百行减少到只有几行。

         除了面向更有经验的理论化学家的命令行界面外,AutoSolvate 还包括一个直观的图形界面,适合学习运行模拟的研究生。

         自动溶剂网建立在这个基础上。

         扩展访问

         通过主要在云基础设施上运行,AutoSolvateWeb 克服了硬件配置挑战,进一步拉平了复杂计算研究的学习曲线。 聊天机器人在前端通过自然语言而不是计算机代码进行交流,而 AutoSolvateWeb 在后端自动执行软件流程。

         “化学家可以花更少的时间学习编写计算机代码,这样他们就可以更专注于他们在他们想要解决的特定问题上的努力,“Liu 解释道。 “我们还希望让学生能够自己运行仿真,以便他们能够更全面地了解溶液中分子的动力学。”

         AutoSolvateWeb 聊天机器人不是像 ChatGPT 这样的大型语言模型 (LLM) 聊天机器人,而是主要基于规则。 它不像真人那样就一系列主题进行交谈,而是针对特定任务,类似于用于在线客户服务的聊天机器人银行业。

         聊天机器人提示用户输入感兴趣的分子名称,例如咖啡因,然后选择一种溶剂来溶解咖啡因,例如水。 该系统利用来自 PubChem 的数据,PubChem 是由美国国立卫生研究院汇编的世界上最大的可免费访问的在线化学信息集合。

         聊天机器人引导用户逐步完成云环境,无缝集成所需的多个开源软件程序工作流。 通过自动化流程计算出所有适当的参数后,AutoSolvateWeb 会将结果提交给美国国家科学基金会的超级通勤者来创建模拟。

         超级通勤者返回一个轨迹文件。 用户可以下载此文件并使用开源软件将该文件转换为他们请求的模拟的 3D 电影。

         眼见为实 - 了解

         AutoSolvateWeb 有望增强化学教学方式。

         “作为计算机变得越来越强大,它们对科学研究变得越来越重要,“任说。 “本科化学学生需要熟悉计算机模拟,这样他们才能跟上研究方式的进步。”

         他引用了溶剂变色法(一种分析液体中化学物质组成的技术)作为计算机模拟在教育中的力量的一个例子。

         本科生通常通过以下方式在实验室实验中学习溶剂变色将称为 Riechart 染料的溶质溶解在不同的溶剂中。 溶液变成蓝色、红色、绿色或黄色,具体取决于溶质分子吸收光的方式。

         对这种现象的最简单解释是,颜色变化是由于溶剂极性的变化造成的。 极性的变化以不同的方式稳定分子的基态,这反过来又会影响分子沿光波长的吸收峰。

         更难解释的是异常到这个规则。 有时,由于溶质和溶剂之间形成氢键的方式,相似极性的溶剂会产生不同的颜色。

        “为了充分了解氢键在这种情况下如何发挥特殊作用,学生需要运行计算机模拟,”Liu 说。 “眼见为实。 你需要直接观察运动中的结构,这样你才能在微观尺度上理解事物。

         这种详细的可视化帮助学生学习她说,批判性地思考,这样他们就可以超越记住教科书中的概念,而是做出和分析自己的发现。

         “在科学中,我们不想只了解正在发生的事情,”任 补充道。 “我们想知道为什么会这样。”

         小分子,大数据

         Liu 和她的同事现在正在努力扩大 AutoSolvateWeb 可以模拟的化学系统的范围,超越诸如单个有机分子作为溶质等限制。 他们还在增强该平台不仅能够生成数据,而且能够以开源格式在化学社区中存储和自由交换这些数据。

         研究人员希望他们为实现计算化学研究民主化所做的开创性工作将激发整个自然科学领域的类似举措。 任 解释说,他们的最终目标是帮助连接基础科学各个领域的人工智能,增强跨学科研究的力量。