De rode panda en Cserhati (13): het BMC Genomics artikel
In het BMC
Genomics artikel gebruikt Cserhati twee datasets en twee typen methoden om de
beste indeling, de "phylogenetic placement", van de rode panda te
vinden. De natuurlijke indeling van de soorten representeert hun verwantschap,
en verwantschap tussen soorten en families is altijd interessant.
De twee typen
methoden die Cserhati gebruikt zijn clustering en fylogenetische methoden. De
twee data sets zijn Whole Genome K-mer Signatures van 28 soorten, en mtDNA
sequenties van 52 soorten.
Cserhati is
op op zoek naar de "phylogenetic placement" van de rode panda (zoals
hij zegt in de tweede zin van zijn abstract) en dan is clustering geen
bruikbare methode. Clustering is geen fylogenetische methode en levert geen
fylogenie, dus ook geen "phylogenetic placement". Clustering kan niet
gebruikt worden om tot monofylie van een groep of groepen te besluiten. Cserhati
zegt in Methods: "... using
clustering algorithms to detect monophyletic groups", en dat is fout,
want clustering is niet in staat monofylie te detecteren.
In de
bespreking van de resultaten van de WGKS data staat:
Ailurus fulgens clearly clusters together with the mustelids,
Based on this
evidence [ "Ailurus fulgens
clearly clusters together with the mustelid" ], Ailurus fulgens would belong to mustelids as a monophyletic group.
De eerste zin
is niet controversieel maar niet interessant voor de indeling van de rode panda
Ailurus fulgens. De tweede zin is op
twee manieren fout. Ten eerste kan monofylie niet uit clustering afgeleid. Ten
tweede is 'monofylie' en 'behoren tot dezelfde familie' niet hetzelfde.
2 Fylogenetische methoden op de twee
datasets.
2.1 WGKS
Op de WGKS
data set met 28 soorten is één fylogenetische analyse methode toegepast, UPGMA.
De UPGMA
fylogenetische boom laat vooral zien dat WGKS niet goed bruikbaar is voor
fylogenie (BMC Genomics figuur 2). De heel grote verschillen, die tussen de
kattenfamilie, berenfamilie en de superfamilie Musteloidea, worden op de juiste
manier gevonden. De splitsing die gevonden wordt binnen de Musteloidea hoort
bij de mogelijkheden, gegeven alle andere studies over de rode panda. Binnen de
marterfamilie staan de wezels en de otters door elkaar. Binnen de kattenfamilie
staan de 'grote katten' en de 'kleine katten' door elkaar. Voor de meer
verwante soorten geeft WGKS troep. In het Abstract schrijft Cserhati:
(WGKS) Being a
genomics-based algorithm, it also reduces stochastic error to a minimum.
Aan de
resultaten in figuur 2 te zien, is dit niet juist. Stochastic error is hoog.
2.2 mtDNA
Op de mtDNA
dataset met 52 soorten heeft Cserhati drie fylogenetische methoden toegepast.
De UPGMA
methode geeft een verder in de literatuur niet gevonden plaatsing van
marterfamilie en rode panda als zustergroep, in aanwezigheid van soorten van de
wasbeerfamilie.
Cserhati
interpreteert de fylogenetische bomen uit de NJ analyse en uit de ML analyse volgens
de lay-out, en gaat daarmee de mist in. Het had Cserhati toch moeten
verontrusten dat in zijn interpretatie de superfamilie Musteloidea niet opdook.
Bij invullen
van de berenfamilie als buitengroep blijkt dat beide analyses hetzelfde
splitsingspatroon van de superfamilie Musteloidea opleveren: de eerste splitsing
is die van rode panda Ailuridae tegen stinkdieren + wasberen + marterfamilie,
de tweede splitsing is die van stinkdieren tegen wasberen + marterfamilie. De
wasberen en de marterfamilie blijken zustergroepen. Dit is een bekend
verwantschapspatroon binnen de superfamilie Musteloidea, gevonden in een aantal
artikelen.
In zijn
weergave van de resultaten bij de mtDNA dataset blijkt Cserhati slordig. In
het Abstract staat:
A Maximum
Likelihood tree suggests that A. fulgens and Ursidae form a monophyletic group,
although the bootstrap value is weak.
Dit hoort bij
Cserhati's interpretatie van de NJ fylogenetische boom, niet de ML boom. Hij
haalt zijn resultaten door elkaar.
3 Opvallend is dat in deze analyse van
mtDNA het woord voor buitengroep 'outgroup' niet voorkomt.
Nog
opvallender is dat het idee zustergroep 'sister group' helemaal niet voorkomt. Twee
zustergroepen zijn samen monofyletisch. Waar Cserhati 'monofylie' wil gebruiken
om te betogen dat de rode panda bij de marterfamilie Mustelidae hoort, laat die
monofylie een zustergroep relatie tussen de families Ailuridae en Mustelidae
zien. Monofylie betekent niet: behorend tot dezelfde familie.
4 In het Abstract zegt Cserhati:
Conclusions:
The main conclusion that we can draw from this study is that on a whole genome
level Ailurus fulgens possibly belongs to the mustelid clade,
Dit is
nergens op gebaseerd. Het is afkomstig uit de WGKS clustering, waar 'cluster' en
'clade' verward worden.
5 De inleiding wemelt van de fouten.
6 Zoals ik op Panda's Thumb schreef:
"One problem: how did a paper as bad as this ever get
through review and published?"
***
Cserhati, M., 2021, A tail of two pandas – whole
genome k-mer signature analysis of the red panda (Ailurus fulgens) and the
Giant panda (Ailuropoda melanoleuca), BMC Genomics 22: 228
https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-021-07531-3
https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-5-de.html
https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-7-wgks-is.html
https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-8-clustering.html
https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-9-clusters-op.html
https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-12.html
http://pandasthumb.org/archives/2022/12/a-tale-of-two-papers.html
Reacties
Een reactie posten