De rode panda en Cserhati (13): het BMC Genomics artikel

In het BMC Genomics artikel gebruikt Cserhati twee datasets en twee typen methoden om de beste indeling, de "phylogenetic placement", van de rode panda te vinden. De natuurlijke indeling van de soorten representeert hun verwantschap, en verwantschap tussen soorten en families is altijd interessant.

De twee typen methoden die Cserhati gebruikt zijn clustering en fylogenetische methoden. De twee data sets zijn Whole Genome K-mer Signatures van 28 soorten, en mtDNA sequenties van 52 soorten.

 

1       Clustering

Cserhati is op op zoek naar de "phylogenetic placement" van de rode panda (zoals hij zegt in de tweede zin van zijn abstract) en dan is clustering geen bruikbare methode. Clustering is geen fylogenetische methode en levert geen fylogenie, dus ook geen "phylogenetic placement". Clustering kan niet gebruikt worden om tot monofylie van een groep of groepen te besluiten. Cserhati zegt in Methods: "... using clustering algorithms to detect monophyletic groups", en dat is fout, want clustering is niet in staat monofylie te detecteren.

In de bespreking van de resultaten van de WGKS data staat:

Ailurus fulgens clearly clusters together with the mustelids,

Based on this evidence [ "Ailurus fulgens clearly clusters together with the mustelid" ], Ailurus fulgens would belong to mustelids as a monophyletic group.

De eerste zin is niet controversieel maar niet interessant voor de indeling van de rode panda Ailurus fulgens. De tweede zin is op twee manieren fout. Ten eerste kan monofylie niet uit clustering afgeleid. Ten tweede is 'monofylie' en 'behoren tot dezelfde familie' niet hetzelfde.

 

2       Fylogenetische methoden op de twee datasets.

2.1    WGKS

Op de WGKS data set met 28 soorten is één fylogenetische analyse methode toegepast, UPGMA.

De UPGMA fylogenetische boom laat vooral zien dat WGKS niet goed bruikbaar is voor fylogenie (BMC Genomics figuur 2). De heel grote verschillen, die tussen de kattenfamilie, berenfamilie en de superfamilie Musteloidea, worden op de juiste manier gevonden. De splitsing die gevonden wordt binnen de Musteloidea hoort bij de mogelijkheden, gegeven alle andere studies over de rode panda. Binnen de marterfamilie staan de wezels en de otters door elkaar. Binnen de kattenfamilie staan de 'grote katten' en de 'kleine katten' door elkaar. Voor de meer verwante soorten geeft WGKS troep. In het Abstract schrijft Cserhati:

(WGKS) Being a genomics-based algorithm, it also reduces stochastic error to a minimum.

Aan de resultaten in figuur 2 te zien, is dit niet juist. Stochastic error is hoog.

 

2.2    mtDNA

Op de mtDNA dataset met 52 soorten heeft Cserhati drie fylogenetische methoden toegepast.

De UPGMA methode geeft een verder in de literatuur niet gevonden plaatsing van marterfamilie en rode panda als zustergroep, in aanwezigheid van soorten van de wasbeerfamilie.

Cserhati interpreteert de fylogenetische bomen uit de NJ analyse en uit de ML analyse volgens de lay-out, en gaat daarmee de mist in. Het had Cserhati toch moeten verontrusten dat in zijn interpretatie de superfamilie Musteloidea niet opdook.

Bij invullen van de berenfamilie als buitengroep blijkt dat beide analyses hetzelfde splitsingspatroon van de superfamilie Musteloidea opleveren: de eerste splitsing is die van rode panda Ailuridae tegen stinkdieren + wasberen + marterfamilie, de tweede splitsing is die van stinkdieren tegen wasberen + marterfamilie. De wasberen en de marterfamilie blijken zustergroepen. Dit is een bekend verwantschapspatroon binnen de superfamilie Musteloidea, gevonden in een aantal artikelen.

In zijn weergave van de resultaten bij de mtDNA dataset blijkt Cserhati slordig. In het Abstract staat:

A Maximum Likelihood tree suggests that A. fulgens and Ursidae form a monophyletic group, although the bootstrap value is weak.

Dit hoort bij Cserhati's interpretatie van de NJ fylogenetische boom, niet de ML boom. Hij haalt zijn resultaten door elkaar.

 

3       Opvallend is dat in deze analyse van mtDNA het woord voor buitengroep 'outgroup' niet voorkomt.

Nog opvallender is dat het idee zustergroep 'sister group' helemaal niet voorkomt. Twee zustergroepen zijn samen monofyletisch. Waar Cserhati 'monofylie' wil gebruiken om te betogen dat de rode panda bij de marterfamilie Mustelidae hoort, laat die monofylie een zustergroep relatie tussen de families Ailuridae en Mustelidae zien. Monofylie betekent niet: behorend tot dezelfde familie.

 

4       In het Abstract zegt Cserhati:

Conclusions: The main conclusion that we can draw from this study is that on a whole genome level Ailurus fulgens possibly belongs to the mustelid clade,

Dit is nergens op gebaseerd. Het is afkomstig uit de WGKS clustering, waar 'cluster' en 'clade' verward worden.

 

5       De inleiding wemelt van de fouten.

 

6       Zoals ik op Panda's Thumb schreef:

"One problem: how did a paper as bad as this ever get through review and published?"

 

***

 

Cserhati, M., 2021, A tail of two pandas – whole genome k-mer signature analysis of the red panda (Ailurus fulgens) and the Giant panda (Ailuropoda melanoleuca), BMC Genomics 22: 228

https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-021-07531-3

https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-5-de.html

https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-7-wgks-is.html

https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-8-clustering.html

https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-9-clusters-op.html

https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-12.html  

http://pandasthumb.org/archives/2022/12/a-tale-of-two-papers.html

 

 

Reacties