De rode panda en Cserhati (9): clusters op WGKS data
Cserhati
gebruikt twee technieken voor de plaatsing van de rode panda en de reuzenpanda
op grond van de Whole Genome K-mer Signatures, een fylogenetische boom en
clustering.
Cserhati legt
niet veel nadruk op de fylogenetische boom op grond van zijn WGKS gegevens,
maar geeft ruim aandacht aan clustering van de 28 soorten. Op grond van
clustering zegt Cserhati bij 'Results and Discussion':
Based on this
evidence, A. fulgens would belong to mustelids
as a monophyletic group.
Bij 'Conclusion' zegt Cserhati:
In conclusion, A. fulgens possibly belongs to
Mustelidae, based on the analysis of the WGKS.
De
fylogenetische boom op grond van WGKS geeft aan dat de rode panda de
zustergroep is van de marterfamilie Mustelidae, maar niet tot de marterfamilie
behoort. Deze uitspraken van Cserhati komen van zijn clustering van de WGKS
data.
Wat doet
Cserhati met de WGKS data?
In zijn
analyse maakt hij een correlatiematrix, van de paarsgewijze correlaties van de WGKS
data van de soorten. Deze matrix geeft hij weer in een 'heatmap' waarin de
grootte van de correlatie weergegeven wordt op een licht-donker schaal.
Figuur 1 Heatmap: paarsgewijze correlaties op WGKS data. De
volgorde op de x-as van links naar rechts is dezelfde als de volgorde op de
y-as van beneden naar boven. De zuid-west naar noord-oost diagonaal geeft
identiteit. Rode pijl: rode panda Ailurus
fulgens; groene pijl stinkdier
Spilogale gracilis. Blauw: familie namen. Lichter is hogere correlatie
tussen soorten. Dit is Cserhati fig 1 BMC Genomics met groepsnamen toegevoegd. |
Hoe de
volgorde van de soorten op de beide assen tot stand kwam wordt niet genoemd in
Cserhatis BMC Genomics artikel. Het is duidelijk dat de katten bij elkaar
staan, en ook de beren en Musteloidea staan bij elkaar. De heatmap geeft
daarmee een grove maar goed inzichtelijke eerste toegang tot de hiërarchische
indeling van de dieren.
Het is
duidelijk dat de rode panda afwijkt van de soorten van de familie Mustelidae: we
zien een 'Finse vlag' patroon: de correlaties van de rode panda met de soorten
van de marterfamilie zijn lager dan de correlaties tussen de soorten van de
familie Mustelidae onderling. Vandaar dat we die donkere strepen zien. Maar
waarom staat de rode panda midden tussen de marterachtigen? Geen uiitleg van
Cserhati.
Laten we nog
even naar de heatmap kijken. Gelukkig heeft Cserhati de getallen van de
correlatie matrix in een van de supplementary files van het artikel gezet,
zodat er via Excel een gekleurde versie van te maken is:
Het is duidelijk zichtbaar dat de rode panda lagere (rodere) correlaties heeft met de soorten van de marterfamilie dan de soorten van de marterfamilie onderling. Het is niet duidelijk waarom de rode panda Ailurus fulgens tussen de marterfamilie Mustelidae geplaatst is. Cserhati zegt:
A. fulgens clearly clusters together with the mustelids,
although on average, it has a lower mean PCC value compared to all the other
species, 0.89 ± 0.03, whereas mustelids have a mean PCC value of 0.95 ± 0.04.
This difference
is not too significant.
De correlatie matrix geeft de mogelijkheid te bepalen hoe significant "not too significant" is. Als we de correlaties als onafhankelijke getallen beschouwen, krijgen we als gemiddelde van alle correlaties van de rode panda met de soorten van de marterfamilie 0.89 ± 0.03, en als gemiddelde van alle correlaties van de soorten van de marterfamilie onderling (zonder rode panda) 0.97 ± 0.2. Dit is een significant verschil. In een twee-zijdige t-test met ongelijke variantie wordt dit verschil gevonden met een kans van P = 1.44 * 10-6. Een eenzijdige t-test met gelijke variantie geeft P = 3.41 * 10-14 . De WGKS correlaties van de rode panda met de soorten marterachtigen verschillen significant van de WGKS correlaties van de marterachtigen onderling. Het blijft onduidelijk waarom Cserhati een significantie van P = 1.44 * 10-6 of P = 3.41 * 10-14 "not too significant" vindt.
Cserhati gebruikt een clustering programma op de gegevens in de correlatiematix, en vindt drie of vier clusters. De katten en de beren geven heldere clusters. De Musteloidea met stinkdier, rode panda en 10 soorten marterachtigen kunnen als een cluster beschouwd worden, maar Cserhati geeft de voorkeur aan het stinkdier op zichzelf en een cluster 11 soorten, de 10 soorten marterachtigen met de rode panda. Waarom is zichtbaar in de heatmaps over alle gebruikte soorten, zodra de assen gesorteerd worden op verschil met de rode panda.
Als we
superfamilie Musteloidea in meer detail in een heatmap bekijken, is duidelijk
dat het stinkdier apart zetten voor de hand ligt. Alleen blijft er niet veel
over van een cluster van 10 soorten marterachtigen + de rode panda: de rode
panda verschilt duidelijk van de marterachtigen. De twee groepen binnen de
familie marterachtigen zijn de twee groepen die in de fylogenetische boom met
UPGMA op de WGKS data gevonden zijn binnen de marterachtigen. (Die rommel
waarin de otters en de wezels vreemd gaan.)
De rode panda clustert weliswaar met de soorten van de familie marterachtigen, maar de rode panda verschilt van de marterachtigen; zoals ook in de fylogenie op dezelfde data. Het is duidelijk uit de fylogenie dat de rode panda en de marterfamilie monofyletisch zijn, maar als zustergroepen: niet omdat de rode panda tot de marterfamilie Mustelidae zou behoren. Wanneer Cserhati zegt:
Based on this
evidence, A. fulgens would belong to mustelids as a monophyletic group.
dan is het "monophyletic" correct, maar "would
belong to mustelids" niet.
Cserhati, M., 2021, A tail of two pandas – whole
genome k-mer signature analysis of the red panda (Ailurus fulgens) and the
Giant panda (Ailuropoda melanoleuca), BMC Genomics 22: 228
https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-021-07531-3
https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-8-clustering.html
https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-7-wgks-is.htm
https://en.wikipedia.org/wiki/Heat_map
Reacties
Een reactie posten