De rode panda en Cserhati (15): de data en resultaten in het CRSQ artikel

 In zijn Creation Research Society Quarterly artikel gebruikt Cserhati drie typen gegevens om de plaats van rode panda tussen andere soorten te vinden: Whole Genome K-mer Signature, mitochondriaal DNA sequentie, en aminozuurvolgorde in het eiwit cytochroom-b.

De eerste twee sets gegevens, WGKS en mtDNA, zijn dezelfde als in zijn BMC Genomics artikel. Voor de cytochroom-b aminozuurvolgorde gebruikt Cserhati nieuwe gegevens. Er zijn dan gegevens over de volgende aantallen soorten/ondersoorten:

familie

WGKS

mtDNA

aa cytochroom-b

katten Felidae

11

-

25

beren Ursidae

5

15

5

marters Mustelidae

10

30

17

wasberen Procyonidae

0

2

1

stinkdieren Mephitidae

1

3

1

rode panda Ailuridae

1

2

2

 

28

52

51

De wasbeerfamilie ontbreekt bij de WGKS data, al had Cserhati voor twee soorten gegevens kunnen verzamelen. Het artikel van Tsuchiya et al in Genome Biology and Evolution met de genomen van de kinkajoe en de wasbeer is gepubliceerd in januari 2021. Dit lijkt op tijd voor bewerking voor een artikel in het najaar van 2021

 

WGKS

Uit de WGKS gegevens berekent Cserhati een correlatiematrix tussen de soorten. Dit is dezelfde correlatiematrix als in het BMC Genomics artikel, zoals blijkt uit de twee Additional Files. Cserhati geeft heatmaps van de correlatie matrix in beide artikelen: dezelfde figuur, maar anders ingekleurd. 

Figuur 1. Heatmaps van de correlaties op de WGKS data: links als in CRSQ artikel, rechts als in BMC Genomics artikel. De grijsschaal is omgedraaid, verder is het dezelfde figuur.

Figuur 2: Heatmap die de grootte van de correlaties in WGKS tussen de soorten aangeeft. Donkerder is meer overeenkomst. De volgorde van de soorten op de assen is dezelfde van boven naar beneden als van rechts naar links; op de diagonaal zw-no staat de correlatie met de soort zelf. De families zijn links aangegeven: van boven naar beneden marterfamilie, berenfamilie, kattenfamilie. . Figuur 2 CRSQ 2021.

De plaats van de rode panda Ailurus fulgens staat rechts aangegeven, midden tussen de marterachtigen. Dit leidt tot een soort 'Deense vlag' patroon. De enige soort van de stinkdierfamilie Mephitidae in deze data, Spilogale gracilis, is te vinden tussen de beren en de marters, het blokje naast de 'Deense vlag'.

In deze figuur geeft Cserhati families aan: felids, de familie katten Felidae, ursids, de familie beren Ursidae, en mustelids, de familie marterachtigen Mustelidae. Kennelijk worden in de figuur de rode panda en Spilogale tot de marterfamilie gerekend.

In de tekst zegt Cserhati dat er drie clusters gevonden worden in de WGKS data: de katten, de beren en de superfamiie Musteloidea:

... felids covering the family Felidae (eleven species), ursids covering the family Ursidae (five species), and musteloids, a superfamily including Mephitidae and Mustelidae (twelve species).

Er zijn twee opmerkelijke punten bij Cserhati's resultaat 'drie clusters'.

Het eerste opmerkelijke punt is dat Cserhati hier in het CRSQ artikel tot drie clusters komt, en in het BMC Genomics artikel op precies dezelfde resultaten vier clusters geeft. In het BMC Genomics artikel wordt het stinkdier Spilogale gracilis apart gezet als vierde cluster. Hier wordt Spilogale gracillis bij het grote cluster Musteloidea gerekend. Cserhati geeft silhouette plots voor 3 clusters en voor 4 clusters: vier met Spilogale als afzonderlijk cluster. De silhouette-wijdte nul voor Spilogale geeft aan dat clustering in het naastliggende cluster beter is. De silhouette plots laten betere clustering met drie clusters zien.


Figuur 3. Silhouette plots voor 3 clusters (boven, CRSQ supplementary figure 1) en voor 4 clusters (onder CRSQ supplementary figure 2). Cserhati geeft geen omschrijving voor de x-as. De vijf soorten van de berenfamilie zijn boven geel, onder blauw. De elf soorten van de kattenfamilie boven grijs en onder geel. De twaalf soorten van de superfamilie Musteloidea zijn boven blauw en grijs / rood onder.

Het tweede opmerkelijke punt is dat Cserhati de rode panda indeelt bij de marterfamilie Mustelidae - iets dat hij had moeten aantonen, maar hier zonder argumentatie aanneemt. De rode panda verschilt van alle soorten marterachtigen: het is duidelijk te zien in de heatmap. 

Figuur 4. De WGKS heatmap van Cserhati ingekleurd: groener is hogere correlatie, roder is lagere correlatie. Minimum correlatie: .44. Deze heatmap is heeft precies dezelfde correlaties als zwart-wit figuur 2 hier.

Uit figuur 2 en 4 blijkt duidelijk dat de grote verschillen zijn tussen de katten linksonder en alle andere soorten. Om verschillen binnen de superfamilie Musteloidea helder te krijgen, is het beter om op dezelfde correlaties een heatmap voor de Musteloidea allen te maken.

 

Figuur 5. Heatmap van de Musteloidea, zonder katten en beren. De volgorde van de soorten is dezelfde als in figuur 2 en figuur 4. Nu is lagere correlatie tussen de rode panda Ailurus fulgens en de soorten van de marterfamilie duidelijk zichtbaar.


Het verschil is statistisch significant (blogpost Cserhati 9). De rode panda mag dan clusteren binnen de superfamilie Musteloidea, het is geen mustelid, geen marterachtige.



 

mtDNA base sequenties

Ook uit de mitochondriaal DNA sequentie gegevens berekent Cserhati een correlatiematrix tussen de soorten. Dit is dezelfde correlatiematrix als in het BMC Genomics artikel. Cserhati geeft een heatmap van de correlatiematrix: anders ingekleurd, met de soorten anders gerangschikt. 

Figuur 6. Heatmaps van de correlaties op de mtDNA data: links als in CRSQ artikel, rechts als in BMC Genomics artikel. De grijsschaal is omgedraaid; de twee ondersoorten van de rode panda zijn in het CRSQ artikel helemaal linksonder geplaatst, en in het BMC Genomics artikel te vinden als het kleine lichte blokje tussen de twee grotere lichte blokken.


 

Figuur 7: Heatmap die de grootte van de correlaties in mtDNA sequentie tussen de soorten aangeeft. Donkerder is meer overeenkomst. De volgorde van de soorten op de assen is dezelfde van boven naar beneden als van rechts naar links; op de diagonaal zw-no staat de correlatie met de soort zelf. De rode panda ondersoorten staan linksonder. Figuur 3 CRSQ 2021.

Cserhati geeft de volgende interpretatie:

In this heatmap we can see two main, large clusters as well as three smaller ones.

Met de twee grote clusters zullen de beren ursids en de marterachtigen mustelids zijn bedoeld. De interpretatie met twee grote clusters en drie kleine clusters wordt aannemelijk gemaakt door de plaatsing van de twee rode panda ondersoorten linksonder (Ailurus) en de plaatsing van de twee wasbeerachtigen (procyonids) en de drie stinkdieren (mephitids) rechtsboven. Zo is moeilijk te zien dat de correlaties van de rode panda met de mustelids, mephitids en procyonids lichtgrijs kleuren langs de onderrand, donkerder dan bij de beren.

De correlaties zijn te vinden in Additonal File 2 van het artikel. Ik heb de volgorde van de families langs de assen veranderd, en de correlatie matrix wat helderder ingekleurd voor een duidelijker heatmap. 

 

Figuur 8. Heatmap die de grootte van de correlaties in mtDNA sequentie tussen de soorten aangeeft. Groener is meer overeenkomst, roder is meer verschil. Minimum correlatie: .75. De volgorde van de soorten op de assen is dezelfde van boven naar beneden als van rechts naar links; op de diagonaal nw-zo staat de correlatie met de soort zelf. Figuur 3 CRSQ 2021 met verandering van volgorde van de families en kleuren.

Nu hebben we een helder plaatje. Er zijn twee grote groepen, met de berenfamilie Ursidae linksboven en rechtsonder de superfamilie Musteloidea met de families Mephitidae stinkdieren, Ailuridae rode panda, en Procyonidae wasberen. Binnen de Musteloidea lijkt meer variatie te bestaan dan binnen de beren, namelijk de families en onderfamilies.

Figuur 9. Heatmap uit figuur 8 met families en onderfamilies binnen de Musteloidea aangegeven.

Er zijn wat verschillen zichtbaar tussen de familie marterachtigen Mustelidae en de andere drie families in de superfamilie Musteloidea. Het is iets meer oranje in die banen dan in het vierkant. Dat kan uitvergroot.

Het is mogelijk een heatmap te maken van de superfamilie Musteloidea op zichzelf. De grote verschillen met de beren zijn dan uit de kleuring van de heatmap verdwenen. De verschillen binnen de Musteloidea worden zichtbaar bij voortgezette heatmap kleuring.

 

Figuur 10 Dezelfde correlatiematrix als in de figuren 7, 8 en 9 met de verschillen in grootte van de correlaties binnen de Musteloidea aangegeven.


De verschillen tussen de familie marterachtigen Mustelidae en de andere drie families in de superfamilie Musteloidea zijn nu sprekend. De vier onderfamilies binnen de familie marterachtigen zijn helder zichtbaar.

Dit kan nog verder doorgevoerd, met een heatmap kleuring voor alleen de Mustelidae. Dan komen verschillen in mtDNA tussen de onderfamilies nog wat beter uit.

 

Figuur 12 Dezelfde correlatiematrix als in de figuren 7, 8, 9 en 10 met de verschillen in grootte van de correlaties binnen de Mustelidae aangegeven.

Zouden de otters toch ook wat apart staan? Tenslotte zijn otters 'biologically meaningful' verschillend van de andere soorten hier - zwemmers en viseters.

Cserhati interpreteert figuur 7 (zijn figuur 3) alsof de vijf bekende taxonomische families uit de clustering komen.

In this heatmap we can see two main, large clusters as well as three smaller ones.

Er is geen statistische onderbouwing van vijf clusters. Cserhati zegt vijf clusters, maar dan verwacht je een silhouette plot dat dat duidelijk maakt. Uit de silhouette plots die Cserhati geeft blijkt iets anders.

In het BMC Genomics artikel staat in het mtDNA deel midden tussen de  fylogenetische bomen de zin:

Supplementary figure 3 shows the average silhouette width according to the number of clusters, with an average silhouette width of 0.51 for two clusters.

Figure 13. Supplementary figure 3 van het BMC Genomics artikel, silhouette plot met twee clusters Links beren, rechts Musteloidea. Ook in dit sihouette plot zijn de 30 soorten van de marterfamilie en de 7 soorten Musteloidea die niet tot de marterfamilie behoren te zien.

Cserhati heeft silhouette plots voor verschillende aantallen clusters gemaakt, zoals te zien is in Supplementary figure 3 van het CRSQ artikel.
Figure 14. Supplementary figure 3 van het CRSQ artikel shows the average silhouette width according to the number of clusters, with an average silhouette width of 0.51 for two clusters as maximum. Het optimale aantal clusters is 2.

In feite vindt Cserhati twee grote clusters, namelijk de berenfamilie Ursidae en de superfamilie Musteloidea. Zo geeft hij het ook aan in zijn tabel met de statistische gegevens van de clusters, Table 3 van het BMC Genomics artikel. 

Vijf clusters, de vijf klassieke families Ursidae beren, Mephitidae stinkdieren, Ailuridae rode panda, Procyonidae wasberen, Mustelidae marterachtigen is niet beter dan acht clusters. Acht clusters met de vier families Ursidae beren, Mephitidae stinkdieren, Ailuridae rode panda, Procyonidae wasberen en vier onderfamilies, Melinae dassen, Guloninae marters, Lutrinae otters en Mustelinae wezels binnen de marterfamilie is ook mogelijk, even goed als vijf clusters.

 

Aminozuurvolgorde in het eiwit cytochroom b.

Het mitochondriaal DNA bevat onder andere het gen voor het eiwit cytochrome b. Cserhati besluit de aminozuurvolgorde van dit eiwit voor clustering van soorten te gebruiken.

Cytochrome-b is a structurally conservative protein which does not mutate freely. It is often used to infer phylogenetic relationships between organisms (Meyer, 1994), and can so be used in baraminology studies as well.

Cytochroom b was een van de eerste genen waarvoor goede technieken en goede gegevens beschikbaar kwamen. We hebben het dan wel over populariteit 30 jaar geleden, voordat DNA sequenties van het hele mitochondriaal DNA beschikbaar kwamen. Genbank en de NCBI database hebben duizenden entries; data vinden is niet moeilijk.

Cserhati vergelijkt de aminozuurvolgorde in 25 katten, 5 beren (maar niet de reuzenpanda), de twee ondersoorten van de rode panda, het gestreept stinkdier Mephitis mephitis als enige van zijn familie, de neusbeer Nasua nasua als vertegenwoordiger van de wasbeerfamilie, en 17 soorten marterachtigen. De heatmap die Cserhati geeft van de correlatiematrix voor deze soorten is de volgende figuur.

Figuur 15: Heatmap die de grootte van de correlaties in aminozuurvolgorde van cytochroom b tussen de soorten aangeeft. Donkerder is meer overeenkomst. De volgorde van de soorten op de assen is dezelfde van boven naar beneden als van rechts naar links; op de diagonaal zw-no staat de correlatie met de soort zelf. De groepen staan links aangegeven. De twee ondersoorten van de rode panda staan bij het kruisje. De neusbeer en het stinkdier staan in deze lay-out tussen de groep van de beren en de groep met de katten. Figuur 4 CRSQ 2021.

Cserhati schrijft:

In the heatmap (Figure 4) we can see three main clusters and two species by themselves, N. nasua and M. mephitis. In the lower left there is a tight cluster of 25 felids. In the upper right there is a cluster of five ursid species, and another with 19 mustelid species.

Er worden geen silhouette plots gegeven om de drie clusters katten, beren en marterachtigen + panda's en twee niet geclusterde soorten te onderbouwen. Een silhouette plot had duidelijk moeten maken waarom er geen cluster Musteloidea gerapporteerd wordt. Gezien de heatmap is een cluster Musteloidea een mogelijkheid.

De rode panda wordt zonder meer tot de marterachtigen Mustelidae gerekend. Zoals blijkt uit de heatmap (fig 15 hier, fig 4 Cserhati) is dit niet vanzelfsprekend. De twee ondersoorten van de rode panda vormen duidelijk een blokje naaste de soorten van de familie Mustelidae; ook de correlaties van de rode panda met de marterachtigen zijn weer lager dan de correlaties van de marterachtigen onderling, zoals aan de grijswaarden te zien is.

Dit wordt duidelijker in een rood-groen heatmap. De correlaties zijn te vinden in Additonal File 3 van het artikel. Ik heb de volgorde van de families langs de assen veranderd, en de correlatie matrix wat helderder ingekleurd voor een duidelijker heatmap.

Figuur 16. Heatmap die de grootte van de correlaties in aminozuurvolgorde van cytochroom b tussen de soorten aangeeft. Groener is meer overeenkomst, roder is meer verschil. Minimum correlatie: .84. De volgorde van de soorten op de assen is dezelfde van boven naar beneden als van rechts naar links; op de diagonaal nw-zo staat de correlatie met de soort zelf. Figuur 4 CRSQ 2021 met verandering van volgorde

Er is een homogene groep katten, de weinige beren zijn ook homogeen, en de superfamilie Musteloidea marterachtigen, de neusbeer, het stinkdier en de rode panda's blijkt nogal heterogeen. De neusbeer is de bovenste in de Musteloidea, dan volgt het stinkdier, en dan de twee ondersoorten rode panda's. Neusbeer en stinkdier verschillen van rode panda en marterachtigen, maar meer van de beren en de katten.

Alleen de superfamilie Musteloidea inkleuren kan ook.

Figuur 17. Als figuur 16 met alleen de Musteloida ingekleurd als heatmap rood-groen.

En inkleuren van alleen rode panda en de familie marterachtigen geeft:

Figuur 18. Als figuur 16 met alleen de rode panda en de marterachtige ingekleurd als heatmap rood-groen.

Het is niet zozeer dat de rode panda bij de familie marterachtigen hoort, als wel dat de neusbeer Nasua nasua zoveel verschilt van de andere soorten uit dezelfde superfamilie.


Cserhati gebruikt een vreemde selectie soorten om na te gaan of de rode panda aan de hand van cytochroom b bij de marterachtigen zou horen. Waarom 25 soorten katten? Die katten doen er niet veel toe in de analyse; hoogstens drijven ze de niet-katten in een heatmap naar kleuren die dichter op elkaar zitten. Als we willen weten waar de rode panda binnen de superfamilie Musteloidea geplaatst moet worden, moeten we soorten uit de Musteloidea gebruiken.

Cserhati geeft zijn Fasta file met aminozuurvolgordes voor cytochrome b niet,wel de nummers van de accessies die hij gebruikt heeft. Ik heb de aminozuur volgorde van cytochroom b voor de marterachtigen, beren, rode panda, stinkdier, neusbeer en zeven soorten katten opgezocht in de NCBI database. Dit heb ik aangevuld met de aminozuurvolgorde van een ander stinkdier, en tien soorten van de wasbeerfamilie Procyonidae. Dit geeft de volgende heatmap:

Figuur 19. Correlatiematrix met meer Musteloidea. Heatmap die de grootte van de correlaties in aminozuurvolgorde van cytochroom b tussen soorten aangeeft. Groener is meer overeenkomst, roder is meer verschil. Minimum correlatie: .85. De volgorde van de soorten op de assen is dezelfde van boven naar beneden als van rechts naar links; op de diagonaal nw-zo staat de correlatie met de soort zelf.

De superfamilie Musteloidea blijkt ook hier behoorlijk heterogeen. In meer detail:



Binnen de familie Procyonidae komen sommige soorten vrij veel overeen met de famiie Mustelidae, maar verschillen andere soorten sterk van de Mustelidae. Een van de soorten die sterk verschillen is de neusbeer Nasua nasua. De keuze voor alleen de neusbeer in de heatmap van Cserhati doet de rode panda meer op de marterachtigen lijken dan over het geheel van de Procyonidae gerechtvaardigd is.

 

Conclusies

De WGKS clustering geeft drie groepen: de familie katten Felidae, de familie beren Ursidae en de superfamilie Musteloidea.

De mtDNA clustering geeft twee groepen: de familie beren en de superfamilie Musteloidea.

De cytochrome b clustering geeft een cluster katten, een cluster beren en is onduidelijk over de Musteloidea.

De heatmaps geven aan dat de rode panda in geen van deze drie analyses binnen de familie Mustelidae valt.

Ook is te zien dat clustering de biologie niet goed  weergeeft. De mtDNA analyse geeft twee clusters, maar de heatmap laat duidelijk zien hoeveel detail er bij clustering verloren gaat.

 

 Slordigheden:

Blz 78: whole genome sequence voor Procyonidae is niet gedownload

Blz 79, Table 1: Spilogale gracilis bij cluster 3, de katten

Blz 81: "... the WGKS analysis, where the average silhouette width was 0.8 for classifying M. mephitis ..." Het is Spilogale gracilis in de WGKS analyse, niet Mephitis mephitis.

In figuur 2 is de tekst is hier niet in overeenstemming met de figuur. De figuur had links 'musteloids', niet 'mustelids' moeten geven.

 

***

Cserhati, M., 2021, Classification of the Enigmatic Red Panda (Ailurus fulgens) Based on Molecular Baraminology-Based Analysis, Creation Research Society Quarterly 58 (2): 76-84

https://www.creationresearch.org/classification-of-the-enigmatic-red-panda-ailurus-fulgens-based-on-molecular-baraminology-based-analysis

M.T.N Tsuchiya, R.B Dikow, K.P Koepfli, P.B Frandsen, L.L Rockwood, J.E Maldonado, 2021. Whole-Genome Sequencing of Procyonids Reveals Distinct Demographic Histories in Kinkajou (Potos flavus) and Northern Raccoon (Procyon lotor) Genome Biology and Evolution, Volume 13, Issue 1, January 2021, evaa255, https://doi-org.proxy.library.uu.nl/10.1093/gbe/evaa255. Published: 17 December 2020

https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-10-wasberen.html

https://en.wikipedia.org/wiki/Silhouette_(clustering)

https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-9-clusters-op.html

https://creationismeweersproken.blogspot.com/2023/01/de-rode-panda-en-cserhati-11-clustering.html

Hennigan, T. 2010. The case for holobaraminic status in bears (family Ursidae) and the implications within a creation model of ecology. CRSQ 46(4):271–283.

Meyer, A. 1994. Shortcomings of the cytochrome b gene as a molecular marker. Trends in Ecology & Evolution 9(8):278–280

Reacties