De rode panda en Cserhati (9): clusters op WGKS data

Cserhati gebruikt twee technieken voor de plaatsing van de rode panda en de reuzenpanda op grond van de Whole Genome K-mer Signatures, een fylogenetische boom en clustering.

Cserhati legt niet veel nadruk op de fylogenetische boom op grond van zijn WGKS gegevens, maar geeft ruim aandacht aan clustering van de 28 soorten. Op grond van clustering zegt Cserhati bij 'Results and Discussion':

Based on this evidence, A. fulgens would belong to mustelids as a monophyletic group.

Bij 'Conclusion' zegt Cserhati:

In conclusion, A. fulgens possibly belongs to Mustelidae, based on the analysis of the WGKS.

De fylogenetische boom op grond van WGKS geeft aan dat de rode panda de zustergroep is van de marterfamilie Mustelidae, maar niet tot de marterfamilie behoort. Deze uitspraken van Cserhati komen van zijn clustering van de WGKS data.

Wat doet Cserhati met de WGKS data?

In zijn analyse maakt hij een correlatiematrix, van de paarsgewijze correlaties van de WGKS data van de soorten. Deze matrix geeft hij weer in een 'heatmap' waarin de grootte van de correlatie weergegeven wordt op een licht-donker schaal.

 

Figuur 1 Heatmap: paarsgewijze correlaties op WGKS data. De volgorde op de x-as van links naar rechts is dezelfde als de volgorde op de y-as van beneden naar boven. De zuid-west naar noord-oost diagonaal geeft identiteit. Rode pijl: rode panda Ailurus fulgens; groene pijl stinkdier Spilogale gracilis. Blauw: familie namen. Lichter is hogere correlatie tussen soorten. Dit is Cserhati fig 1 BMC Genomics met groepsnamen toegevoegd. 

Hoe de volgorde van de soorten op de beide assen tot stand kwam wordt niet genoemd in Cserhatis BMC Genomics artikel. Het is duidelijk dat de katten bij elkaar staan, en ook de beren en Musteloidea staan bij elkaar. De heatmap geeft daarmee een grove maar goed inzichtelijke eerste toegang tot de hiërarchische indeling van de dieren.

Het is duidelijk dat de rode panda afwijkt van de soorten van de familie Mustelidae: we zien een 'Finse vlag' patroon: de correlaties van de rode panda met de soorten van de marterfamilie zijn lager dan de correlaties tussen de soorten van de familie Mustelidae onderling. Vandaar dat we die donkere strepen zien. Maar waarom staat de rode panda midden tussen de marterachtigen? Geen uiitleg van Cserhati.

 

Laten we nog even naar de heatmap kijken. Gelukkig heeft Cserhati de getallen van de correlatie matrix in een van de supplementary files van het artikel gezet, zodat er via Excel een gekleurde versie van te maken is:

Figuur 2 Heatmap volgens Cserhati op paarsgewijze correlaties op WGKS data. De volgorde op de x-as van links naar rechts is dezelfde als de volgorde op de y-as van beneden naar boven. De zuid-west naar noord-oost diagonaal geeft identiteit. Groener is hogere correlatie tussen soorten, roder is lagere correlatie tussen soorten Rode pijl: rode panda Ailurus fulgens; groene pijl stinkdier Spilogale gracilis. Blauw: familie namen. Dit is Cserhati fig 1 BMC Genomics met groepsnamen toegevoegd, en ingekleurd. 


Figuur 3 Heatmap volgens Cserhati op paarsgewijze correlaties op WGKS voor Musteloidea. Groener is hogere correlatie tussen soorten, roder is lagere correlatie tussen soorten. De volgorde op de x-as van links naar rechts is dezelfde als de volgorde op de y-as van beneden naar boven. De zuid-west naar noord-oost diagonaal geeft identiteit. Dit is een deel van Cserhati fig 1 BMC Genomics met groepsnamen toegevoegd, en ingekleurd. Het is duidelijk dat de rode panda niet op een goede plek zit.


Het is duidelijk zichtbaar dat de rode panda lagere (rodere) correlaties heeft met de soorten van de marterfamilie dan de soorten van de marterfamilie onderling. Het is niet duidelijk waarom de rode panda Ailurus fulgens tussen de marterfamilie Mustelidae geplaatst is. Cserhati zegt:

A. fulgens clearly clusters together with the mustelids, although on average, it has a lower mean PCC value compared to all the other species, 0.89 ± 0.03, whereas mustelids have a mean PCC value of 0.95 ± 0.04.

This difference is not too significant.

De correlatie matrix geeft de mogelijkheid te bepalen hoe significant "not too significant" is. Als we de correlaties als onafhankelijke getallen beschouwen, krijgen we als gemiddelde van alle correlaties van de rode panda met de soorten van de marterfamilie 0.89 ± 0.03, en als gemiddelde van alle correlaties van de soorten van de marterfamilie onderling (zonder rode panda) 0.97 ± 0.2. Dit is een significant verschil. In een twee-zijdige t-test met ongelijke variantie wordt dit verschil gevonden met een kans van P = 1.44 * 10-6. Een eenzijdige t-test met gelijke variantie geeft P = 3.41 * 10-14 . De WGKS correlaties van de rode panda met de soorten marterachtigen verschillen significant van de WGKS correlaties van de marterachtigen onderling. Het  blijft onduidelijk waarom Cserhati een significantie van P = 1.44 * 10-6  of P = 3.41 * 10-14 "not too significant" vindt.

Cserhati gebruikt een clustering programma op de gegevens in de correlatiematix, en vindt drie of vier clusters. De katten en de beren geven heldere clusters. De Musteloidea met stinkdier, rode panda en 10 soorten marterachtigen kunnen als een cluster beschouwd worden, maar Cserhati geeft de voorkeur aan het stinkdier op zichzelf en een cluster 11 soorten, de 10 soorten marterachtigen met de rode panda. Waarom is zichtbaar in de heatmaps over alle gebruikte soorten, zodra de assen gesorteerd worden op verschil met de rode panda.

Figuur 4 Heatmap op paarsgewijze correlaties op WGKS data van Cserhati. De correlaties zijn gesorteerd op overeenkomst met de rode panda, die nu op de x-as helemaal rechts en op de y-as voenaan staat. De volgorde op de x-as van links naar rechts is dezelfde als de volgorde op de y-as van beneden naar boven. De zuid-west naar noord-oost diagonaal geeft identiteit. Groener is hogere correlatie tussen soorten, roder is lagere correlatie tussen soorten Rode pijl: rode panda Ailurus fulgens; groene pijl stinkdier Spilogale gracilis. Blauw: familie namen


Figuur 5 Detail van figuur 4, alleen de 12 soorten van de Musteloidea. Heatmap op paarsgewijze correlaties op WGKS data van Cserhati. De correlaties zijn gesorteerd op overeenkomst met de rode panda, die nu op de x-as helemaal rechts en op de y-as voenaan staat. De volgorde op de x-as van links naar rechts is dezelfde als de volgorde op de y-as van beneden naar boven. De zuid-west naar noord-oost diagonaal geeft identiteit. Groener is hogere correlatie tussen soorten, roder is lagere correlatie tussen soorten Rode pijl: rode panda Ailurus fulgens; groene pijl stinkdier Spilogale gracilis. Blauw: familie namen



Als we superfamilie Musteloidea in meer detail in een heatmap bekijken, is duidelijk dat het stinkdier apart zetten voor de hand ligt. Alleen blijft er niet veel over van een cluster van 10 soorten marterachtigen + de rode panda: de rode panda verschilt duidelijk van de marterachtigen. De twee groepen binnen de familie marterachtigen zijn de twee groepen die in de fylogenetische boom met UPGMA op de WGKS data gevonden zijn binnen de marterachtigen. (Die rommel waarin de otters en de wezels vreemd gaan.)

 

Al met al:

De rode panda clustert weliswaar met de soorten van de familie marterachtigen, maar de rode panda verschilt van de marterachtigen; zoals ook in de fylogenie op dezelfde data. Het is duidelijk uit de fylogenie dat de rode panda en de marterfamilie monofyletisch zijn, maar als zustergroepen: niet omdat de rode panda tot de marterfamilie Mustelidae zou behoren. Wanneer Cserhati zegt:

Based on this evidence, A. fulgens would belong to mustelids as a monophyletic group.

dan is het "monophyletic" correct, maar "would belong to mustelids" niet.

 

 

Cserhati, M., 2021, A tail of two pandas – whole genome k-mer signature analysis of the red panda (Ailurus fulgens) and the Giant panda (Ailuropoda melanoleuca), BMC Genomics 22: 228

https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-021-07531-3

https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-8-clustering.html 

https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-7-wgks-is.htm

https://en.wikipedia.org/wiki/Heat_map





Reacties