== 各种病毒的基因组类型总结 ==
dsDNA:（天花，牛痘）,HPV,(水痘，带状疱疹，巨细胞病毒CMV)，腺病毒；大多数噬菌体；猿猴病毒40（SV40）

ssDNA：细小病毒（腺联病毒AAV），鼻病毒，玉米条纹病毒，核盘菌SsHADV-1病毒

dsRNA：呼肠孤病毒（轮状病毒），昆虫质型多角体病毒，玉米矮缩病毒，真菌病毒（核盘菌除外）

+ssRNA：冠状病毒（日冕病毒），脊髓灰质炎，黄病毒（黄热病，乙脑，登革热，丙肝，寨卡），风疹，乙肝丁肝以外的所有肝炎病毒；烟草花叶病毒TMV

-ssRNA：狂犬病，腮腺炎，流感，麻疹，埃博拉，丁肝，汉坦

反转录ssRNA：HIV

反转录dsDNA：乙肝，花椰菜花叶病毒CaMV

* 总结：DNA大多双链除了细小，RNA大多单链除了呼肠孤；负链包括“狂塞遛马爱丁汉”（狂腮流麻埃丁汉）（在狂风大作的塞外遛马的来自爱丁堡的汉子）。正链包括“观日几恼黄热风”（冠日脊脑黄热风）（他在观看日出时好几次因为黄热的风而感到气恼）（黄热代表了好几个黄病毒科的物种）。

== 病毒分类法 ==

=== ICTV 分类法 ===
国际病毒分类委员会（ICTV）是国际微生物学联合会发展、改进和维护通用病毒分类的唯一机构，在1966年建立起了一个病毒分类的通用系统和统一的命名法则。第七届 ICTV 会议首次规范化了病毒物种的概念，即病毒分类的分支层次中的最低分类单元。分类的主要依据是病毒颗粒的特性、抗原特性与生物特性。

到目前为止只有一小部分的病毒得到了研究，从来自人体的病毒样品中发现有20%的序列是未曾发现过的，而来自环境中（如海水、大洋沉积物等）的病毒样品则大部分的序列都是全新的。

病毒分类从域开始，结构如下，分类后缀在括号中：
:域 Realm（''-viria''）
::亚域 Subrealm（''-vira''）
:::界 Kingdom（''-viriae''）
::::亚界 Subkingdom（''-virites''）
:::::门 Phylum（''-viricota''）
::::::亚门 Subphylum（''-viricotina''）
:::::::纲 Class（''-viricetes''）
::::::::亚纲 Subclass（''-viricetidae''）
:::::::::目 Order（''-virales''）
::::::::::亚目 Suborder（''-virineae''）
:::::::::::科 Family（''-viridae''）
::::::::::::亚科 Subfamily（''-virinae''）
:::::::::::::属 Genus（''-virus''）
::::::::::::::亚属 Subgenus（''-virus''）
:::::::::::::::种 Species

ICTV 2020版分类表中总共有6个域、10个界、17个门、2个亚门、39个纲、59个目、8个亚目、189个科、136个亚科、2224个属、70个亚属与9110个种。除亚域、亚界和亚纲外，其他级别的分类单元都被使用。共有6个域、1个地位未定纲、19个地位未定科及2个地位未定属被承认。

=== 巴尔的摩分类法 ===
诺贝尔奖获得者生物学家戴维·巴尔的摩在1970年代提出了巴尔的摩分类系统。巴尔的摩分类法与ICTV分类法一起用于现代病毒的分类。

巴尔的摩分类法是基于病毒 mRNA 的生成机制。在从病毒基因组到蛋白质的过程中，必须要生成mRNA来完成蛋白质合成和基因组的复制，但每一个病毒家族都采用不同的机制来完成这一过程。病毒基因组可以是单链或双链的 RNA 或 DNA，可以有也可以没有反转录酶。而且，单链RNA病毒可以是正义（+）或反义（-）。这一分类法将病毒分为7类：

*第一类是双链 DNA 病毒（如腺病毒、疱疹病毒、痘病毒）
*第二类是单链 DNA 病毒（+）DNA（如小 DNA 病毒）
*第三类是双链RNA病毒（如呼肠孤病毒）
*第四类是（+）单链RNA病毒（如微小核糖核酸病毒、披盖病毒、甲肝病毒、丙肝病毒、黄热病毒、鼻病毒、脊髓灰质炎病毒、风疹病毒）
*第五类是（-）单链RNA病毒（如正黏液病毒（流感病毒）、炮弹病毒）
*第六类是单链RNA反转录病毒（如反转录病毒、人类免疫缺陷病毒）
*第七类是双链 DNA 反转录病毒（如乙肝病毒）
举一个病毒分类的例子：水痘病毒，即带状疱疹病毒，属于疱疹病毒目，疱疹病毒科，甲型疱疹病毒亚科，水疱病毒属；同时，带状疱疹病毒是巴尔的摩分类法中的第一类，因为它是双链 DNA 病毒，且不含有反转录酶。
物种名称通常以[疾病]病毒的形式出现，尤其是高等动植物。
<ref>[https://zh.wikipedia.org/wiki/病毒分类表病毒分类表-维基百科]</ref>
== 卫星 ==
卫星（Satellite）是亚病毒因子的一类，不能单独存在，需要辅助病毒协助复制核酸，或者由辅助病毒提供衣壳蛋白来包被核酸。分为两大类：能利用自己核酸编码衣壳蛋白的为卫星病毒，不能的则称卫星核酸。如丁型肝炎病毒(HDV)必须利用乙型肝炎病毒的包膜蛋白才能完成复制周期，常见的卫星病毒还有腺联病毒(AAV)、卫星烟草花叶病毒(STMV)、卫星玉米白线花叶病毒(SMWLMV)、卫星稷子花叶病毒（SPMV)等。
== 类病毒 ==
类病毒（Viroid）是一种具有传染性的单链环状RNA病原体。它比病毒要小，且没有典型病毒所有的蛋白质外壳。类病毒为严格寄生物，专一性很强。目前所有已知的类病毒均为被子植物栖居者，且多数造成疾病；它们通常透过种子或花粉传播，且整合到细胞核内进行复制。
类病毒最早由在美国工作的瑞士学者迪纳（Theodor O. Diener）于1971年在马铃薯纺锤块茎病中发现。

== 拟病毒 ==
拟病毒又称类类病毒，使指一类包裹在真病毒粒中的有缺陷的类病毒。拟病毒极其微小，一般仅由裸露的RNA组成。与拟病毒“共生”的真病毒又称辅助病毒，拟病毒则成了它的“卫星”。拟病毒的复制必须依赖辅助病毒的协助。同时，拟病毒也可干扰辅助病毒的复制和减轻其对宿主的病害，因此，它可用于生物防治中。

== 朊病毒 ==
朊病毒是一种具感染性的致病因子，能引发哺乳动物的传染性海绵状脑病。朊毒体疾病（传染性海绵状脑病）和阿尔茨海默病、帕金森病同属于神经退行性疾病。最早发现于哺乳动物的传染性海绵状脑病，包括羊搔痒症、疯牛病、慢性消耗病，以及人类的克雅二氏病。它不是病毒，而是仅由蛋白质构成的致病因子。它虽然不含核酸，但可自我复制且具有感染性。朊病毒由错误折叠的朊蛋白（PrP）聚集组成。它能够诱导在神经细胞上原本是正常结构的朊蛋白转变为错误结构并进行聚集反应，借由这个机制引入新的朊蛋白，不断自我复制并传递至邻近细胞，最终扩散至整个脑部。

== 病毒进化史的一个有趣的假说<ref name=":0" /> ==
[[文件:进化史.png|缩略图|<ref name=":0">[https://www.bilibili.com/read/cv5205466/?from=readlist 病毒进化史]</ref>]]
事先声明：以下内容只是一个B站博主的文章，作者已经写明只是个人猜测，并且没有给出参考文献，更不是论文或教材。所谓的进化路线没有经过严谨证明，可以当作一个帮助记忆的方法，千万不要将其视为权威资料！

作者对其提出的进化路线给出的理由如下：

1，类病毒与德尔塔病毒(以下简称丁肝病毒)繁殖方式一样，只是丁肝病毒多了一个德尔塔抗原。(蛇丁肝病毒多了一个疑似德尔塔棘突蛋白)

2，丁肝病毒的RNA是反义RNA，繁殖方式与反义RNA病毒一样(丁肝病毒：转录——德尔塔抗原催化RNA复制；反义RNA病毒：转录——基质蛋白催化RNA复制)

3，丁肝病毒生活需要细胞的DNA依赖的RNA聚合酶（主要是RNA聚合酶II——转录mRNA的RNA聚合酶）进行RNA复制（可见细胞的RNA聚合酶祖先是RNA依赖的RNA聚合酶）

4，正义RNA病毒、反义RNA病毒的RNA依赖的RNA聚合酶与逆转录病毒的逆转录酶拥有共同结构。

5，正义RNA病毒RNA复制时首先形成双链RNA，然后双链RNA转录形成正义RNA；双链RNA病毒首先进行转录形成正义RNA，最终正义RNA转录成为双链RNA，可谓是“师出同门”

6，正义RNA病毒复制时在细胞内形成小体，双链RNA病毒可直接作为小体

7，反义RNA病毒复制时不形成双链RNA，与正义RNA病毒完全不同

8，人体内有内源性博尔纳病毒基因(EBLN-1/2/3P)，而博尔纳病毒正是反义RNA病毒，可见反义RNA病毒可以整合在宿主DNA基因组中，这与逆转录病毒是一样的（可见，反义RNA病毒是逆转录病毒的祖先）

9，反义RNA病毒、逆转录病毒、拟逆转录病毒、单链DNA病毒与双链DNA病毒均可以通过内含子剪辑RNA来改变外显子的表达，这与细胞是一样的

10，逆转录病毒中的泡沫病毒有20%的概率会形成拥有双链DNA的病毒，这种病毒的生活方式与乙肝病毒一样（泡沫病毒中拥有双链DNA的病毒遗传信息流与乙肝病毒均为DNA→RNA→DNA，泡沫病毒中拥有双正义RNA的病毒遗传信息流为RNA→DNA→RNA）

11，乙肝病毒（DR1与DR2）、花椰菜花叶病毒（19S与35S）的DNA上均有两个正向重复序列（direct repeat），用以mRNA转录、pgRNA合成与病毒DNA合成。逆转录病毒的DNA上也有两个重复序列（long terminal repeat），用以mRNA转录、正义RNA合成与病毒DNA合成

12，无论是像HIV的逆转录病毒（retrovirus），还是像乙肝病毒的拟逆转录病毒（pararetrovirus），它们合成双链DNA的逆转录过程中，均会形成单链DNA，而且单链DNA也含有重复序列。而腺相关病毒这种无害的人细小病毒的单链DNA也含有重复序列（inverted repeat）

13，无论是拥有线型单链DNA的腺相关病毒，还是拥有环状单链DNA的M13噬菌体，它们均拥有重复序列以作为启动子

14，人体细胞内的DNA很多都是逆转录病毒（少数为反义RNA病毒）整合而来

15，反义RNA病毒的RNA依赖的RNA聚合酶与逆转录酶、DNA聚合酶和RNA聚合酶结构相似

16，非洲猪瘟病毒与原始细胞的DNA聚合酶均缺失外切酶修复校正功能，由此可知，原始细胞由原始双链DNA病毒进化而来。

17，原始DNA病毒的DNA聚合酶开始没有外切酶修复校正功能，修复校正功能是后期进化而来。原始细胞的DNA细胞的DNA聚合酶也是如此

18，最早出现的外切酶修复校正功能为3'→5'外切酶，最晚出现的外切酶修复校正功能为5'→3'外切酶。

19，真核细胞的染色体与现代双链DNA病毒的DNA均为线型，而细胞的末端为由重复序列组成的端粒，现代双链DNA病毒DNA的末端为重复序列。

20，真核细胞的端粒上有端粒酶用以合成替换引物的DNA，腺病毒的DNA末端有磷蛋白作为DNA复制的引物

讨论:生物信息数据库及工具简介整理

2025-03-23T09:00:00Z

Shiningstars：

背所谓的“搞人小数据库”还不如去NAR（《nuclear acid research》）每年第一刊狂背😅😅😅，一年几百个背去吧孩子😋😋😋[[用户:Astelle|Astelle]]（[[用户讨论:Astelle|留言]]） 2025年3月20日 (四) 18:46 (CST)
非常抱歉，
我不知道我做了什么让你不开心的事情，但希望你对我说这些能让你开心吧
如果我写了不对劲的东西，希望能斧正。如果你有更好的方案，也希望你可以分享
额我不是这个意思，我是说这些数据库不用管。不用在上面耗时间（仅限“搞人小数据库”那几个）
外培的时候被这些东西搞过所以记下来了qwq，谢谢大佬

讨论:生物信息数据库及工具简介整理

2025-03-21T04:35:13Z

Shiningstars：

讨论:生物信息数据库及工具简介整理

2025-03-21T04:24:32Z

Shiningstars：

比对算法

2025-03-20T00:06:23Z

Shiningstars：

介绍三种关于序列比对的算法，矩阵，进化树与更多

== 相似与一致与同源 ==

* 一致度：如果两个序列（蛋白质或核酸）长度相同，那么它们的一致度定义为对应位置上相同的残基（氨基酸或碱基）的数目占总长度的百分比。
* 相似度：如果两个序列长度相同，则相似度定义为它们对应位置上相似的残基与相同的残基的数目和占总长度的百分数。
* 同源性只能用有没有来形容，不能说“70%同源”这种胡话，类似于“这个布尔函数<ref>布尔函数是信息技术课上的一种数据存储形式

只有0和正数两种值</ref>有80%是0”
* 也就是说，一致度要求完全一样，相似度只要性质差不多也能算进去

== 比对类型 ==
局部比对找出两个序列中高相似度的片段

全局比对构建打分矩阵，打分。。。

半局部比对对一条序列使用局部比对，另一条使用全局比对，如此求得最大匹配度

== 比对矩阵 ==
如果希望对蛋白质或核酸序列进行比对，需要借助于矩阵（对于计分表的更高端叫法）打分，分高者相似

=== 核酸矩阵 ===

==== 等价矩阵 ====
将一致的计算为一分，不一致的计算为0分
{| class="wikitable"
|+等价矩阵
!
!A
!T
!C
!G
|-
!A
!1
!0
!0
!0
|-
|T
|0
|1
|0
|0
|-
|C
|0
|0
|1
|0
|-
|G
|0
|0
|0
|1
|}

==== BLAST矩阵 ====
将一致的计算为+4分，不一致的计算为-5分

和上一张差不多

转换/颠换矩阵<ref>转换指的是嘌呤换嘌呤，嘧啶换嘧啶

颠换指的是嘌呤换嘧啶(这么基础感觉没必要多嘴啊w)</ref>

将一致的计+1，转换计算-1，颠换计算-5
{| class="wikitable"
|+
!
!A
!T
!C
!G
|-
!A
!1
!-5
!-5
!-1
|-
|T
| -5
|1
| -1
| -5
|-
|C
| -5
| -1
|1
| -5
|-
|G
| -1
| -5
| -5
|1
|}

=== 蛋白质矩阵 ===

==== PAM矩阵 ====
PAM矩阵是目前蛋白质序列比较中最广泛使用的记分方法之一，基础的PAM-1 矩阵反应的是进化产生的'''每一百个氨基酸平均发生一个突变的量值（统计方法得到）'''。

PAM-1是由相似度大于85%的序列计算产生

PAM-1 自乘n次，可以得到PAM-n，即发生了多次突变。也就是说PAM越大，相似度越小

==== BLOSUM矩阵 ====
BLOSUM 矩阵都是通过对大量符合特定要求的序列计算而来。如BLOSUM62表示计算了相似度>62%的蛋白质序列得到结果
[[文件:屏幕截图(8).png|缩略图|比较PAM和BLOSUM]]

==== GCM矩阵/遗传密码子矩阵 ====
两个氨基酸之间密码子所需的突变次数越多，替换代价越大（多用于进化树）

==== 疏水矩阵 ====
疏水性相近的氨基酸得分更高

== 比对序列 ==

=== 动态规划 ===
核心原理是，如果你每一步都是最优解，那最后也一定是最优解

也就是说，因为你在列表走格子的时候每次都取了最优解，所以比对结果也应该是最优解

1950由理查德贝尔曼开发

=== 打点法 ===
[[文件:序列比对笑传之compare cat brothers.png|缩略图|compare cat brothers]]
首先您需要找到两条序列THEFASTCAT和THEFATCAT

将他们将两条序列用这一张图中的方法分别列出，形成一个二维表格，在字母相同（实际上是氨基酸相同）的位置打上点

如果您发现打点后产生了对角线或者与其相同的平行线，这些区域具有一致性

可用于寻找序列中的重复片段

许多名字里带有Dot的软件可以用打点法比对序列如Dnadot，（dotlet似乎属于SIB

=== 全局比对之Needleman-Swunch算法 ===
1970年由名字里的二人开发

换一种方法理解打点法，您会发现她很像一种打分，只不过是0/1
[[文件:NStrue.png|缩略图|Needlemanswunch矩阵初始化]]
下面我们使用更加酷炫的动态规划（走格子），Needleman-Swunch的走格子步骤如下

1，初始化矩阵，将两条序列用上一张图中的方法分别列出并且在开头处空一格，形成一个二维表格，在表格的左上角的边缘打上0，-1，-2，。。。一直到表格结束

2

Shiningstars：

=== 杨海明和马伟元有明显的生态位分化 ===
杨海明只用黑板下半部，马伟元只用黑板上半部。

=== 请问人有几个规管？ ===
三个半。

=== 方孝孺被朱棣满门抄斩 ===
自此脊索动物门全部灭绝。

=== 在两栖类中胸骨发达的肋骨不发达，肋骨发达的胸骨不发达，故两栖无胸廓 ===
青蛙王子被公主亲吻后化为人身，第一句话便是：“感谢你让我长出胸廓！”

=== 生物学按照界门纲目科属种的方式来分类 ===
因此科比纲门小。

=== 哪一种蜜蜂不能飞？ ===
科比（kobe）

蜜蜂英文bee，一个无聊的谐音梗

=== 哪一种蜜蜂杀人数量最多？ ===
无人机。

笑点解析：“无人机”和“雄蜂”的英文都是drone，雄蜂是一种蜜蜂，而无人机被广泛运用于现代战争中，造成了大量的人员伤亡。

=== 反式脂肪酸 ===
笑点解析：左图是一种顺式脂肪酸（''cis'' fat），而右图是“''trans'' fat”，可理解为反式脂肪酸，也可理解为“trans（跨性别者）”的“fat（胖子）”，生物化学与政治正确的碰撞，令人忍俊不禁。[[文件:反式脂肪酸.png|缩略图]]

=== 蚯蚓属于什么门什么纲？ ===
有口有肛门有口有纲（肛）

=== 性内选择 ===
有一次班上两个男的为一个女的打架，教练为了教导我们不要早恋，于是就问我们，他们两个人这是属于什么行为？有同学回答，不团结行为甚至有同学回答，违法行为，只有我一个人弱弱的说了一句性内选择。

=== 这是什么选择 ===
2024年的三四月份，正是苦逼孤寂的停课时光，偌大的教室里只有ling与一位留级学姐持续内卷，并有机会进行不为人知的猎奇话题讨论。

连续几套练习题到处是同性恋的相关研究，雄果蝇头尾相接围成一圈雌果蝇冷落圈内的图片隔三岔五地出现。

某个下午我灵光一闪，摊开动物行为学问学姐：一个女生喜欢另一个女生，这是性间还是性内选择？

学姐：......

me：那两个女生为了同一个女生而竞争，是性间还是性内选择？

学姐：......

=== 胡罗唐诗集 ===
某奥赛教练因微信名而被学生尊称为胡萝卜，一日在进行生态行为复习时胡老师在大脑过载后突发恶疾，韦尼克区损坏导致进入化境，语言与思想难以李姐，故时人记之，曰《胡罗唐诗集》

《胡罗唐诗集》

土壤是壤土。

酸雨主要成分是盐酸。

红树林没有盐度周期性变化。

触角腺和绿腺是皮肤腺。

黄外光是红光。人看到的主要是红外光。

无限的微分是自然对数的底?

多度丰度频度不如直接用盖度表示优势度。

=== 豌豆花的花语…… ===
是9331。

=== 为什么说我是次生韧皮部 ===
因为我身边一圈周皮（舟批）

===实验生物学家、理论生物学家和我===

理论生物学家做不出实验，但是知道为什么。

实验生物学家做得出实验，但是不知道为什么。

而我是一个完美的生物学家，既做不出实验，也不知道是为什么。

===喜欢孟德尔怎么办？===
答案是变成豌豆，这样孟德尔就会给你♂授♂精♂

===想变成南梁怎么办？===
答案还是变成豌豆，这样孟德尔就会给你♂去♂雄♂

=== 万艾可是抗生素 ===
万艾可能够治疗（抑制）ED

ED在此处既指勃起功能障碍，又指代微生物的ED代谢途径