病原版“ChatGPT”?华大研发超快速病原检测软件让你大开眼界!(痛心!两个月亏损20万,平安银行忽悠理财历经3年,终于被判!)
最近ChatGPT火出圈啦!如今人工智能越来越多地应用于各个领域,深圳华大基因研究人员开发了一种新的基于GPU加速的超快速病原检测方法,用于从海量复杂的mNGS数据中快速识别病原体。该研究成果在2023年3月14日发表于国际知名学术期刊Briefings In Bioinformatics。
宏基因组测序技术 (mNGS) 是一种在临床微生物检测中检测病原体的强大诊断工具。快速而准确地鉴定宏基因组序列是mNGS检测干实验室步骤中鉴定病原体的关键步骤。然而,在临床时限内快速正确检测病原序列的挑战阻碍了该检测技术的临床应用,检测软件GPmeta正是基于此来开发设计,从而加速分析周期,保证了检测的时效性。
研究人员称这个超快速病原检测软件为GPMeta,可以从复杂的、海量的mNGS测序数据中快速而准确地识别病原体。使用模拟数据集和来自真实临床样本的宏基因组测序数据集,与现有的常用工具软件Bowtie2、Bwa、Kraken2和Centrifuge进行比较分析,结果表明GPMeta不仅具有更高的准确性,而且具有更显著快速的运行速度。此外,GPMeta具有用于聚类并重新校正歧义的序列比对的GPMetaC功能模块,能显著提高对高度同源物种的鉴定效能。GPMetaC表现出比其他方法更优的精确度和召回率。新软件GPMeta将在需要极短周转时间的传染病mNGS检测中起到关键的作用。
通过对临床标本中所含的全部核酸序列进行高通量测序来进行病原体检测的方法,被称为mNGS检测。它是一种强大的不依赖于培养的诊断工具,可以以无偏倚的方式进行广谱病原体的鉴定,能够在一次检测中同时检测患者体内几乎所有新的和已知的病原微生物,在感染诊断中具有巨大的潜在应用。它改变了常规传统的诊断方法,如培养、涂片显微镜检查和血清学检测,这些传统方法耗时长且敏感性低。更快、更早地检测致病病原体对于精确的抗生素治疗而不是经验性治疗至关重要。
mNGS检测包括两步:(1) 湿实验室实验操作:临床样本预处理、核酸提取、文库制备和测序;(2) 生物信息学分析:原始测序数据预处理、去除人类宿主序列、与病原体数据库的序列比对、微生物序列的鉴定。其中生物信息学分析是mNGS检测的最后一步关键步骤,需要快速、准确地完成,以加快整个检测过程。然而,即时而准确的计算分析仍然在临床mNGS检测中面临较大的挑战和限制。迫切需要新的策略来加速病原鉴定的生物信息学分析。
研究人员开发了一种称为GPMeta的新型GPU加速方法,能超快速地从复杂的mNGS数据中准确识别病原体。GPMeta采用简洁的哈希检索策略,并支持分割较大的病原序列库来充分利用多GPU同时执行。此外,提出了 GPMeta的可选聚类校正模块GPMetaC来重新调整歧义而模糊的比对序列。
PMseq病原微生物高通量基因检测正是基于mNGS技术,提取感染标本中全部微生物的核酸经过不同的样本前处理,在华大自主高通量测序平台上进行测序,通过专用高质量临床数据库PMDB比对和智能化算法分析,获得疑似致病微生物的种属信息及代表性耐药和毒力基因检测信息,在今后,GPMeta也将会应用于此产品,从而助力生物信息学分析过程,缩短检测分析周期,协助感染的快速精准诊疗。
为了全面验证GPMeta/GPMetaC的性能,研究人员使用模拟宏基因组数据集和公共临床宏基因组数据集,在不同的评估维度上,与目前最先进的常用工具 (即Bowtie2、Bwa、Kraken2和Centrifuge) 进行了比较分析。此外,研究人员还将GPMeta与基于GPU加速的微生物检测工具cuCLARK进行了对比。
研究人员将GPMeta的执行过程分为三个主要过程:测序数据载入过程,比对过程,结果输出过程。
这里主要介绍比对过程,整个比对过程在GPU中执行。首先,测序序列reads被切分成不同的k-mer,使用哈希索引算法查询哈希化病原库Hash DB,以获得每个k-mer的对应位置,然后使用称为DetectChain的算法关联k-mer来确定候选比对位置。接下来,利用Hamming距离和Smith-Waterman算法对每个候选比对位置计算局部比对得分,并保留比对得分大于60的候选位置及相关比对信息。接着,在得分大于60的候选位置上,建立数学统计模型对所有具有多个候选比对位置的reads (即歧义比对的reads) 进行聚类并重新校正得分,选取校正后得分最大的确定为最优的序列比对位置。最后,根据最优的序列比对,结合带注释的物种分类信息输出最佳的病原鉴定结果。此外,GPMeta的比对过程支持多GPU卡并行执行。
为了评估新方法的性能,研究人员采用以下性能评估指标:
去除人源的准确性:人源序列被正确去除的比例(PHR);病原序列被错误比对到人基因组而被去除的比例(PPA);
病原检测的准确性:精准度 (Precision);召回率 (Recall);
软件运行速度。
GPMeta及GPMetaC能精准地去除人源序列及检测病原序列:
去除人源序列的准确性 (下图A、B):
(a) 与GPMeta和Bowtie2比较, Bwa有最高的PHR,但同时引入了更高的PPA,意味着更多病原序列被错误去除。
(b) GPMeta和Bowtie2有类似的PHR与PPA,优于Bwa。
病原检测的准确性 (下图C、D):
(a) GPMetaC和Bwa具有最高的精准度和召回率
(b) GPMetaC略高于GPMeta, 表明带有聚类校正功能的GPMetaC更优
GPMetaC能精准地检测分辨高度同源物种:
选取相似度85-97%的3个属,葡萄球菌属(下图A)、大肠志贺属(下图B)、耶尔森氏菌属(下图C)作为模拟数据集;
在下图A、C中GPMetaC的准确性优于Bwa,下图B中两者表现一致;
在精准度和召回率上,GPMetaC相比GPMeta提高了约2%,显示出聚类校正功能校正歧义比对序列的有效性能。
软件运行速度对比:
在25M reads数据集上,GPMeta及GPMetaC仅需不到3分钟完成整个检测分析;
在110M reads数据集 (常规mNGS检测数据量) 上,GPMeta及GPMetaC仅需4分钟完成整个检测分析;
比对到整个190Gb的病原库,GPMeta及GPMetaC比Bwa、 Bowtie2分别加速39-50倍、12-35倍;
整个检测分析GPMeta比常用的Bwa、Bowtie2分别加速18倍、12倍。
在真实临床样本中GPMeta具有最优的准确性:
针对三种组织样本 (脑脊液、血液、鼻咽拭子) 数据集分别评估,评估中真实微生物序列的确定标准是:BLASTn将其比对到病原序列库,满足E-value cutoff of 1x10-20, identity>95% and match-rate>0.8 的序列确定为来自真实微生物物种。结果显示,GPMeta和Bwa 展示出最高的精准度和召回率,优于其它常用软件 (下图A、B);
在皮肤微生物样本数据集中,GPMeta 显示出最佳的物种丰度估计,其丰度结果更接近原文献报道的物种丰度 (下图C)。
GPMeta优于现有的基于GPU加速的微生物检测工具cuCLARK:
下图A显示,在20M reads模拟数据集上,GPMeta和cuCLARK全模式均能在半分钟内完成病原库的比对,cuCLARK-l轻模式更快。在准确性方面,下图A、B展示出,GPMeta/GPMetaC可以达到96-98%的精准度和召回率,然而,cuCLARK两种运行模式的精准度和召回率均小于80%。
研究结论
GPMeta/GPMetaC是从海量的mNGS检测数据中及时而准确地识别病原体的有力工具,尤其是在感染临床上,对于消除严重急性感染的威胁以及精准有效的抗生素治疗具有重要意义。此外,GPMeta/GPMetaC能拆分大型微生物基因组库,充分利用多GPU卡进行并行的微生物序列比对,自动合并多个子微生物基因组库的结果,进行物种鉴定分析,这对于根据快速膨胀的微生物基因组库来进行更广泛的病原鉴定具有重要意义。
来源:财经三分钟(qgq1818)
作者:杨瑞
*本文已获得转载授权
无规矩不成方圆,
对银行来说,要想走得久、走得远,合规无疑是最好的方法。
然而,很多人就是守着规矩当空气,拿着豆包不当干粮;
从民生银行30亿“飞天”假理财案,到农业银行14亿“萝卜章”事件,再到广发银行的虚假保函……
一桩桩、一件件,触目惊心,合规似乎已经成了一件奢侈品。
中央一次次痛下狠手,不断的罚,不断的骂,
然而总是止不住人性的贪婪,利益的熏心。
费尽心机灭了硕鼠,不料却又来了苍蝇。
近期,又爆出平安银行顶风作案,
忽悠老人买理财,令当事人两个月巨亏20万,引起舆论一片哗然。
◆平安银行忽悠老人买理财,两个月巨亏20万
这还得从2015年6月3日说起。
当天,上了年纪的王某挟揣90万,到平安银行购买理财产品。
根据当时的风险评测结果,老人的等级只属于平衡型,根本无法承受太高的风险。
然而平安银行却拼命劝说老人购买自己家的产品------平安大华混合基金,甚至不惜承诺,不会亏损,可以放心购买。
抱着银行是国家的,国家是可靠的这种信念,老人把90万全部买了平安大华混合基金。
谁知好景不长,平安大华混合基金突然暴跌,不到两个月,老人就巨亏20万,亏损率高达20%以上。
20万,对富商巨贾来说,或许只是九牛一毛,但对于老人来说,可是养老钱、保命钱,绝对不容有失。
看到理财不成反大亏,老人简直欲哭无泪。
无奈之下,老人只得将平安银行告上法庭。
经过旷日持久的论战,近期,法院终于判定,平安银行必须为这次事件至少承担八成责任,
换句话说,就是要赔偿老人16万元。
虽然终于讨得了一个说法,但已经历时两年半,老人不仅损失了4万元的本金,更是浪费了大量的时间和边际成本。
实在令人心痛。
银行的每一次不合规,无疑流的都是普通人的血。
◆银行业乱象丛生,2017年17万亿资金违规
然而令人心痛的是,银行似乎对于普通人的血并不在乎。
平安银行忽悠老人理财只是银行众多问题中的冰山一角。
自2017年3月末,银监会开展“三三四十”大检查以来,发现的问题简直不计其数。
5.97万个问题,涉及的资金高达17.65万亿,
3452件被行政处罚,1547人被处罚,270人被禁业或禁业一定时期。
罚没资金更是高达29.32亿。
这些躲在银行里的硕鼠,不是各种违法违规,就是随便疯狂套利,甚至无脑自我奖励,疯狂啃食国家,而那些胡乱投资,内外勾结,非法融资更是数不胜数。
甚至被中央总结为:
三违反,违法、违规、违章;
三套利:监管套利、空转套利、关联套利;
四不当:不当创新、不当交易、不当激励、不当收费;
以及十乱象。
欺骗老人理财,对这些硕鼠们来说,简直就是小菜一碟,他们早已经养成了习惯。
其疯狂程度,简直令人一身冷汗。
这些藏在银行里的硕鼠们,仿佛不搞崩经济,不弄死银行就浑身发痒一样。
如果说中国有什么系统性金融风险,至少有一半无疑都是这些硕鼠们造成的
如果不是银监会疯狂大扫除,及时制住了这些任性的熊孩子们,真不知掉这些熊孩子们还会闹出什么乱子。
◆需要银行监管趋严,更需要长效机制
进入2018年,中央好不容易费尽心机剿灭了众多硕鼠,又岂能让一群苍蝇再继续飞。
所以今年的银行整治无疑将更严格。
从公司治理,到影子银行,到交叉金融产品风险,到侵害消费者;
从宏观控制,到非法利益输送,到违规操作、展业;
中央都已经做好了大力整顿的准备。
但无论再怎么整治,似乎总是无法面面俱到。
虽然中国的金融业起步较晚,但却也并不完全是摸着石头过河,而是有着欧美日等发达国家丰富的历史经验提供借鉴。
但如今,很多欧美国家曾经踩过的坑,我们依然在踩。
假如我们一直这样依靠行政处罚,头痛医头,脚痛医脚,恐怕中央就是累死,也抵不住人性的贪婪。而如果稍稍放松,可能又会痛起来了。
我们迫切需要一套完整、实用的管理方法和监管制度,去遏制人性的贪婪和投机。去建立一个强大的金融体系,真正支撑的起中华民族的崛起。
声明:本文仅代表作者个人观点,不构成投资建议。版权归作者所有;若未能找到作者和原始出处,还望谅解;如有侵权,麻烦联系我们,我们会在确认后第一时间删除。多谢!
责任编辑:
标签: