Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Калибровка Скоростей Мутаций
Rodstvo.ru > ДНК-генеалогия и другие научные направления > Расчёт возрастов, скорости мутаций, константы
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
wertner
Продолжение обсуждения на старом форуме.
Цитата("jurgan")
Цитата("wertner")
Цитата("jurgan")
есть повод посчитать по ... О'Нилам.

для меня там мало 67-маркерных гаплотипов, иеньше 10. жаль :-(
буду искать для калибровки кого-нибудь другого.

МакГрегоров и О'Брайенов посмотрите.


МакГрегоров посмотрел. Там есть близкие 67-маркерные гаплотипы 22 человек. Но нет точных данных, что они потомки Ian Cam (Ian of the One-Eye). Возможно, во время Ian Cam было уже несколько ветвей МакГрегоров. К тому же построенное дерево не позволяет точно выделить предка клана. Но все равно спасибо.

У О'Брайенов, к сожалению, нет привязки к историческим данным.

Посмотрел еще Williams (534 участника) - там только 37-маркерные гаплотипы и нет больших групп.

Walker (486 участников) - есть большая группа из 67-маркерных гаплотипов. Но нет очевидной привязки к историческим данным, хотя приведены предки на 200-300

лет для многих участников.

Brown (481 участник) - нет больших групп.

Johnson (480 участников) - нет привязки к историческим данным, даже не выделены группы

Rose (466 участников) - не смог найти результаты тестов

Donnachaidh (417 участников) - примечателен хорошо расписанной генеалогией Робертсонов. Но нет больших групп.

Fraser (403 участника) - не выделены группы, нет привязки к историческим данным.

Graves (355 участников) - есть две группы 67-маркерных гаплотипов (примерно по десятку человек). И много генеалогических данных. Для калибровки подходят две ветви:
первая ветвь "Graves & Greaves Families Possibly Descended from the Greaves Family of Beeley, Derbyshire", есть 67-маркерные гаплотипы потомков John

1490-1546.
вторая ветвь "Greaves Family of Northamptonshire & Buckinghamshire, England", есть 67-маркерные гаплотпы потомков Thomas b. 1624 (около десятка).

MacLaren (349 участников) - не выделены группы.

Baker (323 участника) - в группах мало 67-маркерных гаплотипов

Davis (301 участник) - нет больших групп и исторических данных

Turner (299 участников) - только 37 маркеров

Moore (290 участников) - нет больших групп и только 37 маркеров.

Hill (290 участников) - нет больших групп

Harris (288 участников) - есть группа из 67-маркерных гаплотипов потомков Thomas Harris (ca. 1636-ca. 1688) of Isle of Wight Co., Virginia (около десятка)

Wilson (283 участника) - не выделены группы

Phillips (280 участников) - нет больших групп

Bolling (278 участников) - нет больших 67-маркерных групп

Stewart (275 участников) - нет больших групп

Southern Smith (274 участника) - нет больших групп

Hamilton (272 участника) - две группы 67-маркерных гаплотипов (около десятка), которые подходят для калибровки. В первой из них есть потомки Walter Fitzgilbert de

Hamilton, b about 1275, можно будет по дереву посмотреть кто еще принадлежит этой ветви. Во второй группе есть потомки Sir James Hamilton (the first Lord

Hamilton) born about 1415 and died in 1479, в ней также надо смотреть кто принадлежит этой ветви, а кто нет.

Итого: для калибровки можно попытаться использовать семьи MacDonald, MacGregor, Harris, по две группы Graves и Hamilton.
wertner
Ответ на сообщение
Цитата(aklyosov)
1. Какой смысл считать по МакДональдам, когда все давно посчитано.


Смысл калибровать скорости заново есть, например, когда в выборке используются нестандартные наборы гаплотипов. Это может быть 9-10 гаплотипов, причем некоторые из них не входят в 12-маркерные гаплотипы FTDNA.

И еще надо калибровать заново, когда меняется способ подсчета возраста предка. Например, когда Вы стали выделять молодых предков, то после этого надо посчитатать МакДональдов новым способом. На мой взгляд, там две ветви разных возрастов и время общего предка МакДональдов после раздельного подсчета возрастов может измениться. И тогда Вам при подсчете возрастов предков других выборок стоит использовать немного откорректированные скорости мутаций.

И еще пример когда необходима калибровка. Я рассчитал относительные скорости мутаций. Но для того, чтобы перейти к абсолютным скоростям мутаций, опираясь на Ваши скорости мутаций 6, 12, 25, 37, 67-маркерных гаплотипов мне надо найти корни линейного уравнения 6, 12, 25, 37, 67-ой степени. Проще заново откалибровать скорость изменения гаплотипа.
Yurgan
Уважаемый aklyosov,
Ньяль Десять Заложников родился ок.350 года
NIALL MOR (Niall of the Nine Hostages), High King of Ireland in 357; d. 365 A.D.
Его потомство составляет род с самой глубокой известной генеалогией

Haplogroup R1b1c7 was shown to be especially common among family names which claim a descent from Niall, e.g. O'Boyle, Bradley, Campbell, Cannon, Canane, Mongan, McCaul, McCawell, Connor, O'Doherty, O'Donnell, O'Gallagher, Flynn, McKee, Devlin, Donnelly, Egan, Gormley, McGovern, Hynes, O'Kane, McLaughlin, McManus, McMenamin, Molloy, Muldoon, O'Neill, O'Reilly, O'Rourke, O'Lunny and Quinn

Общий предок Макдональдов, МакДоннэлов, МакАлистеров Дональд, лорд Островов ум.1250 г., родился, вероятно, 1180-1200

The Norse-Gaelic Clan Donald traces its descent from Domhnall mac Raghnaill (d. circa 1250),[1] whose father Reginald or Ranald was styled "King of the Isles" and "Lord of Argyll and Kintrye".[2] Ranald's father, Somerled was styled "King of the Hebrides", and was killed campaigning against Malcolm IV of Scotland at the Battle of Renfrew in 1164.

The MacAlisters descend from Alasdair Mor a younger son of Donald of Islay, founder of Clan Donald and great-grandson of King Somerled.

The McDonnells of Antrim are descended from John Mor MacDonald, chief of the Clan MacDonald of Dunnyveg. John Mor MacDonald was the second son of Good John of Islay, Lord of the Isles, 6th chief of Clan Donald (d. 1386). Through John of Islays second marriage to Princess Margaret Stewart, daughter of King Robert II of Scotland.

Разницы существенная.
О'Брайены помоложе О'Нилов, но род многочисленный

Brian mac Cennétig (c. 941; 23 April 1014), called Brian Bórumha (English: Brian Boru, Irish: Brian Boraime), was an Irish king who overthrew the centuries-long domination of the Kingship of Ireland by the Uí Néill.

И Гамильтоны, и Гордоны и МакДональды и Стюарты – все помоложе.
Yurgan
Цитата(wertner @ 7.7.2008, 23:13) *
Ответ на сообщение


Смысл калибровать скорости заново есть, например, когда в выборке используются нестандартные наборы гаплотипов. Это может быть 9-10 гаплотипов, причем некоторые из них не входят в 12-маркерные гаплотипы FTDNA.

И еще надо калибровать заново, когда меняется способ подсчета возраста предка. Например, когда Вы стали выделять молодых предков, то после этого надо посчитатать МакДональдов новым способом. На мой взгляд, там две ветви разных возрастов и время общего предка МакДональдов после раздельного подсчета возрастов может измениться. И тогда Вам при подсчете возрастов предков других выборок стоит использовать немного откорректированные скорости мутаций.

И еще пример когда необходима калибровка. Я рассчитал относительные скорости мутаций. Но для того, чтобы перейти к абсолютным скоростям мутаций, опираясь на Ваши скорости мутаций 6, 12, 25, 37, 67-маркерных гаплотипов мне надо найти корни линейного уравнения 6, 12, 25, 37, 67-ой степени. Проще заново откалибровать скорость изменения гаплотипа.

Полностью с Вами согласен, для разномаркерных гаплотипов (отличающихся о стандарта FTDNA) надо высчитывать скорости каждый раз заново.

wertner
Цитата(Yurgan @ 7.7.2008, 21:41) *
Уважаемый aklyosov,
Ньяль Десять Заложников родился ок.300 года
NIALL MOR (Niall of the Nine Hostages), High King of Ireland in 357; d. 365 A.D.
Его потомство составляет род с самой глубокой известной генеалогией

Haplogroup R1b1c7 was shown to be especially common among family names which claim a descent from Niall, e.g. O'Boyle, Bradley, Campbell, Cannon, Canane, Mongan, McCaul, McCawell, Connor, O'Doherty, O'Donnell, O'Gallagher, Flynn, McKee, Devlin, Donnelly, Egan, Gormley, McGovern, Hynes, O'Kane, McLaughlin, McManus, McMenamin, Molloy, Muldoon, O'Neill, O'Reilly, O'Rourke, O'Lunny and Quinn


Yurgan, а есть ли основания считать, что самый близкий предок перечисленных родов именно Niall of the Nine Hostages, живший в IV веке, а не его многожды-правнук, живший в веке VII или IX? Ведь это тоже важно для калибровки скоростей.
aklyosov
Коллеги,

Вы, естественно, можете калибровать что угодно и по чему угодно. И получать любые цифры, которые будут все отличаться друг от друга. Но на самом деле вы загоняете себя в ту самую банку с червями, а не просто открываете ее. Потому что вы опять идете на раздрай в величинах средних скоростей мутаций. Потому что никому не будет понятно, какие скорости из многих следует применять. И мы опять откатимся в хаос.

Как известно, не стоит ремонтировать то, что не сломано. Но неуемное желание таки ремонтировать - оно губит.

Я уже приводил много примеров расчетов с существующими скоростями мутаций, которые я калибровал. Что, у кого-то не сошлись данные, полученные с теми скоростями? Причем данные проверенные? Видимо, нет, все в порядке. Так откуда это неуемное желание менять то, что не сломано?

Например, у меня средняя скорость мутаций для 6-маркерных гаплотипов 0.0096 мут/маркер/поколение. Допустим, при перекалибровке по другой генеалогии получится 0.0097 или 0.0098. Что это реально поменяет? Ничего. А станет уже две скорости, 0.0096 и 0.0098. Какую применять? А черт ее знает. Всё, система сломана. А смысл?

Мои первые две скорости, 0.0096 и 0.024 уже проверены на международном сайте по скоростям мутаций индивидуальных маркеров, совпадение почти полное. Зачем менять?

В новом выпуске Вестника я привел письмо ирландского коллеги, который прислал мне 8 25-маркерных гаплотипов своих далеких родственников, и просил посчитать возраст общего предка. У меня получилось 1783+/-25 год. Он прислал восторженное письмо, на самом деле оказалось 1767 и 1797. Нужно менять?

Еще пример. Тед Кандел написал в YSearch, что общий предок гаплогруппы G2c у евреев жил между 1399 и 1492 годами. По моим расчетам оказалось 1433+/-50 лет. Нужно менять?

Сейчас, кстати, он поменял на период между 1360 и 1390 годами. Все равно перекрывание с моей датой. Нужно менять?

Я получаю, что у целого ряда еврейских гаплогрупп 650 лет назад наблюдается прохождение сильного бутылочного горлышка популяции. Действительно, 650 лет назад, в середине 14-го века, была эпидемия черной оспы в Европе, погибли от 15 до 25 миллионов человек.

Нужно менять?



Clavis
О калибровке отдельных маркеров я думаю так. Есть много статей где гаплотип состоит из нестандартного числа маркеров: пять-девять из первой панели плюс два-три из другой панели. Конечно, возраст считаем не по одному маркеру а по всем сразу. Легко посчитать, что средняя погрешность по девяти маркерам втрое ниже, чем по одному.
Павел Шварев
Дополню ответ Клависа, откалиброванные скорости по маркерам, нужны не просто так, а для задач филогении, по русски говоря, для точности построения древ.
aklyosov
Clavis
>Есть много статей где гаплотип состоит из нестандартного числа маркеров: пять-девять из первой панели плюс два-три из другой панели. Конечно, возраст считаем не по одному маркеру а по всем сразу. Легко посчитать, что средняя погрешность по девяти маркерам втрое ниже, чем по одному.

Это - другой вопрос. В статье в последнем Вестнике (на русском языке) я описал эту ситуацию, и дал откалиброванные величинв по 5-, 7-, 9- и 10-маркерным гаплотипам, причем 9- и 10-маркерных было несколько (с разными маркерами). Недавно я откалибровал для Jurgan нестандартный набор 10-маркерных гаплотипов, где 10-й маркер был 438-й, вообще из третьей панели.

Естественно, такие калибровки надо делать. Но это все основано на одном наборе гаплотипов, а именно Мак-Доналдов. Тогда калибровка по 5 маркерам или по 11 не ОТМЕНЯЕТ системы, а дополняет ее, оставляя другие средние скорости теми же.

Если же 5-маркерный откалибровать по Пупкину, то он не будет стыковаться с 6-маркерным по Мак-Доналдам, и данные невозможно будет сравнивать. Поэтому если речь идет о калибровке по одному гаплотипу, то это сделает данные несравнимыми с массой других.

Если менять - то надо менять ВСЮ СИСТЕМУ. Уже ясно, что 6- и 12-маркерные средние скорости менять нельзя, они уже жестко завязаны на скорости индивидуальных маркеров. Значит, речь идет уже ТОЛЬКО о перекалибровке 25-, 37- и 67-маркерных гаплотипов, и ТОЛЬКО в том случае, если данные получатся ЗНАЧИТЕЛЬНО другими, и ТОЛЬКО в том случае, если они покажут значительно лучшую стыковку между 12-, 25-, 37- и 67-маркерными гаплотипами, причем на многих примерах.

Мне интересно, понимают ли активисты перекалибровки объем этой задачи??

aklyosov
А что такое "откалиброванные скорости по маркерам"? Этим занимаются десятки человек, есть подробные таблицы, это постоянно обсуждается на англоязычных сайтах. Этим занимаются администраторы всех разделов YSearch. ЧТО здесь предполагается сделать? Какой вклад в мировую ДНК-генеалогию мы этим сделаем? Надо же видеть, что это явно не приоритетное (для нас) занятие. Никто в мире и не заметит. Что, это самый главный вопрос тех, кто здесь присутствует? Это - главный вопрос "отечественной" ДНК-генеалогии? Главнее, чем понять древнюю историю России? Главнее, чем понять взаимодействие основных родов на территории России? Главнее, чем увеличить число россиян, сделавших тест на гаплотипы? - на примере R1a1, только 15 человек (!!) сделали тест на 25 маркеров и выше. 15 человек из сотни миллионов!

И на этом фоне идут разговоры о важности "перекалибровке" скоростей мутаций ИНДИВИДУАЛЬНЫХ маркеров! Это что, шутка??

Уважаемый Wertner сделал хорошую работу по определению весов, опубликовал. И что? А, к сожалению, в этом плане пока ничего. Потому что в науке СДЕЛАТЬ - это ничего, а УБЕДИТЬ - вот что самое важное. А чтобы убедить, надо построить десятки, а то и сотни картинок, показать, в чем преимущество ДАННОГО метода и ДАННЫХ весов по сравнению со всеми сушествующими, показать, какая принципиально новая информация при этих весах получается, которой не было ранее, в ходе этой работы заодно подправить, и подправить десятки раз, эти самые веса, и в итоге убедить научную общественность, что эта работа действительно является принципиальным шагом вперед - по сравнению с тем, что уже сделано. А сделано много.

Я не сомневаюсь, что эта работа в плане уважаемого Wertner'a, но эта задача как минимум на пару лет хорошей работы. И при этом надо понимать, что она успехом может и не увенчаться, потому что общественность понимала важность этой задачи уже много лет, и не зря программа имеет панель весов с самого начала. То есть у общественности эти веса есть уже давно, и уважаемому Wertner стоило начать свою работу не типа с нуля, а проанализировать веса, которые уже есть в наличии. Я писал об этом в отзыве на его статью, но получил ответ, что это будет сделано позже. На мой взгляд, с этого надо было начинать, но у каждого своя методология.

Вот такие соображения о перекалибровке как весов, так и скоростей мутаций маркеров и гаплотипов в целом. Я, кстати, пока не очень удовлетворен средними скоростями мутаций 25- и 37-маркерных гаплотипов, и по не знаю, это просто разброс по мутациям, или у меня недостаточно оптимизованные скорости. Я этим специально занимаюсь. Но не поиском других моделей, а поиском баланса внутри этих скоростей на реальных примерах. Так, чтобы из 12-, 25, 37- и 67-маркерных гаплотипов получались одни и те же цифры, без тренда. Я пока и тренда-то не вижу, но специально не анализировал. Пока набирал данные. Вот так, по моему мнению, должна проводиться "перекалибровка", а не внесением других моделей и соответствующей путаницы.



mike117
Уважаемый aklyosov, в чем, собственно, смысл вычислений возраста общего предка по схождению гаплотипов, если этот возраст всего-лишь отображает общую закономерность по скорости вытеснения одной линией всех прочих? Нет ли у Вас примеров, когда этот возраст приводит именно к "бутолычным горлышкам" (скажем, переселение кого-то куда-то), а не к этой общей закономерности? 
aklyosov
>...в чем, собственно, смысл вычислений возраста общего предка по схождению гаплотипов, если этот возраст всего-лишь отображает общую закономерность по скорости вытеснения одной линией всех прочих? Нет ли у Вас примеров, когда этот возраст приводит именно к "бутолычным горлышкам" (скажем, переселение кого-то куда-то), а не к этой общей закономерности?

Вопрос не понял. Что это за "общая закономерность" такая? Кто кого "вытесняет"?

"Переселение кого-то куда-то" вовсе не является "бутылочным горлышком". Вот я переселился из Москвы в Бостон, со своей гаплогруппой R1a1 и своим гаплотипом, и что? Если у меня здесь пойдут дети, то они в аккурат своими гаплотипами лягут на дерево славян, вместе с теми, что из Норильска или Владивостока.

У Вас путаница с понятием "бутылочного горлышка".

mike117
Цитата(aklyosov @ 8.7.2008, 21:21) *
У Вас путаница с понятием "бутылочного горлышка".


часть популяции ушла на север в количестве 2-3х кланов. Потом приспособились, размножились, т.е. породили новую макропопуляцию (отдельную от предковой). Вот этот момент с 2-3 кланами и есть бутылочное горлышко этой новой популяции. Какая путаница? Путаница это путать с "бутылочным горлышком" вытеснение одним кланом (одной линией) всех других по "принципу Читуая" в то время как популяция все это время была жива-здорова и с неизменной численностью. Чтоб путаниц избежать, я и предложил модель "сферической лошади" в "Бутылочное горлышко2".
aklyosov
Цитата(mike117 @ 8.7.2008, 13:55) *
часть популяции ушла на север в количестве 2-3х кланов. Потом приспособились, размножились, т.е. породили новую макропопуляцию (отдельную от предковой). Вот этот момент с 2-3 кланами и есть бутылочное горлышко этой новой популяции. Какая путаница? Путаница это путать с "бутылочным горлышком" вытеснение одним кланом (одной линией) всех других по "принципу Читуая" в то время как популяция все это время была жива-здорова и с неизменной численностью.


Я только что описал в другой теме про разницу между бутылочным горлышком и переселением. Переселение как таковое не имеет отношение к бутылочному горлышку. У нас R1a1 на этом форуме предки давно переселились, и не однократно, а мы все по гаплотипам близки. Уж евреи-то как переселялись, а мутации у многих ведут к одному общему предку тысячелетия назад.
Арии в Индию переселились, а у них со славянами один общий предок.

Просто если вы будете рассматривать эти 2-3 клана ТОЛЬКО, в отрыве от других, то у них будет свой общий предок НА ТОЙ ТЕРРИТОРИИ. А мутации в гаплотипах будут продолжать тикать от общего предка на материке.
Yurgan
Цитата(wertner @ 8.7.2008, 6:08) *
Yurgan, а есть ли основания считать, что самый близкий предок перечисленных родов именно Niall of the Nine Hostages, живший в IV веке, а не его многожды-правнук, живший в веке VII или IX? Ведь это тоже важно для калибровки скоростей.

http://members.aol.com/lochlan/dna.htm
Yurgan
Цитата(aklyosov @ 8.7.2008, 7:46) *
Коллеги,

Вы, естественно, можете калибровать что угодно и по чему угодно. И получать любые цифры, которые будут все отличаться друг от друга. Но на самом деле вы загоняете себя в ту самую банку с червями, а не просто открываете ее. Потому что вы опять идете на раздрай в величинах средних скоростей мутаций. Потому что никому не будет понятно, какие скорости из многих следует применять. И мы опять откатимся в хаос.

Хорошо, посчитайте возраст предка
51 25- маркерный гаплотип, 174 мутации на всех по отношению к базовому (предковому)

174/51/скороть aklyosov = ?

Все по родословной и по близости гаплотипов - родственнки.
aklyosov
Хорошо, посчитайте возрат предка
51 25- маркерный гаплотип, 174 мутации на всех по отношению к базовому (предковому)

174/51/скороть aklyosov = ?

Все по родословной и по близости гаплотипов - родственнки.


174/51/0.046 = 74 поколения, или 1850 лет. На самом деле с поправкой на возвратные мутации чуть больше.

А сколько должно быть? Сколько базовых (идентичных) гаплотипов среди этих 51-го?

wertner
Цитата(Yurgan @ 8.7.2008, 23:09) *

Спасибо. Займусь.
Yurgan
Цитата(aklyosov @ 9.7.2008, 2:16) *
Хорошо, посчитайте возрат предка
51 25- маркерный гаплотип, 174 мутации на всех по отношению к базовому (предковому)

174/51/скороть aklyosov = ?

Все по родословной и по близости гаплотипов - родственнки.


174/51/0.046 = 74 поколения, или 1850 лет. На самом деле с поправкой на возвратные мутации чуть больше.

А сколько должно быть? Сколько базовых (идентичных) гаплотипов среди этих 51-го?

Должно быть 1650. Разделение родов произошло около 1600 лет назад.
Наличие идентичных посмотрю. Но эти идентичные должны приближаться к модальному или предковому. А таких нет.

Но собственно, если выкинуть одного, который уж сильно зашкаливает по количеству мутаций, но по маркерам очень похож на родственника, то получим искомые 66 поколений
152/50/0.046 = 66

Так что никто не собирается разрушать систему, надо понять, как считать.

Можно ли сделать вывод, что этот зашкаливший все равно представитель этого же рода, но у которого произошло больше, чем в среднем мутаций? Примерно как у Пузыны - Рюриковича. На дерево ложится, а мутаций много.
aklyosov
>>174/51/0.046 = 74 поколения, или 1850 лет. На самом деле с поправкой на возвратные мутации чуть больше.
>>А сколько должно быть?

>Должно быть 1650. Разделение родов произошло около 1600 лет назад.

Уважаемый Jurgan,

Вы отдаете отчет, что Вы говорите о разнице в 11%?? Да ДНК-генеалоги мечтали бы о такой точности расчетов.

Дело в том, что здесь можете смело ставить плюс-минус 200 лет. И у Вас "около" имеет свой реалистичный плюс-минус. А значит, данные совпали с точностью до погрешности расчетов. Ну, и какая "перекалибровка" Вам нужна?

>Наличие идентичных посмотрю. Но эти идентичные должны приближаться к модальному или предковому. А таких нет.

Они не "должны приближаться", а это синонимы для выборки с одним общим предком. Все три - синонимы. Их там и не должно быть, на 25-маркерных. За 74 поколения из 51 25-маркерных гаплотипов должны остаться полтора базовых гаплотипа, строго говоря.

>Но собственно, если выкинуть одного, который уж сильно зашкаливает по количеству мутаций, но по маркерам очень похож на родственника, то получим искомые 66 поколений

А вот выкидывать не надо, это уже подгонка данных, и вообще волюнтаризм в обращении с экспериментальными данными. Это может далеко завести. Да и не знаете Вы точно, сколько лет на самом деле должно быть. Должны быть объективные критерии для выбрасывания экспериментальных точек. Например, другая гаплогруппа. Или отдельная ветвь на дереве гаплотипов (например, в Вашем случае эта точка отстоит далеко в стороне от основной ветви). Но, повторяю, 11% разницы с Вашими ПРЕДСТАВЛЕНИЯМИ (не точными данными) - это подыгрывание кому-то другому, кто сказал, КАК ДОЛЖНО БЫТЬ. А Ваши данные - главнее.

>Так что никто не собирается разрушать систему, надо понять, как считать.

Нет, речь шла именно о разрушении. Чтобы понять, надо просто упражняться. Я, кстати, нисколько не против разрушения, я против создания нескольких параллельных систем, что неизбежно приводит к неразберихе. А это просто личные амбиции играют, хочется не поняв старое создать свое "новое". Причем при этом амбиции идут рука об руку с неинформированностью и незнанием "старого".

>Можно ли сделать вывод, что этот зашкаливший все равно представитель этого же рода, но у которого произошло больше, чем в среднем мутаций?

Естественно, можно. При любой статистике есть величины выше и ниже средних.
Yurgan
Цитата(aklyosov @ 9.7.2008, 18:14) *
>>174/51/0.046 = 74 поколения, или 1850 лет. На самом деле с поправкой на возвратные мутации чуть больше.
>>А сколько должно быть?

>Должно быть 1650. Разделение родов произошло около 1600 лет назад.

Уважаемый Jurgan,

Вы отдаете отчет, что Вы говорите о разнице в 11%?? Да ДНК-генеалоги мечтали бы о такой точности расчетов.

Дело в том, что здесь можете смело ставить плюс-минус 200 лет. И у Вас "около" имеет свой реалистичный плюс-минус. А значит, данные совпали с точностью до погрешности расчетов. Ну, и какая "перекалибровка" Вам нужна?

>Наличие идентичных посмотрю. Но эти идентичные должны приближаться к модальному или предковому. А таких нет.

Они не "должны приближаться", а это синонимы для выборки с одним общим предком. Все три - синонимы. Их там и не должно быть, на 25-маркерных. За 74 поколения из 51 25-маркерных гаплотипов должны остаться полтора базовых гаплотипа, строго говоря.

Хорошо, хорошо.
Я так понял, одинаковые гаплотипы надо убирать при подсчете по мутациям?
Правильно?
aklyosov
9 гаплотипов рода Doherty
Предок CONOR O'DOCHARTAIGH (was born Abt. 1625 in Tipperary, Ireland,
7 мутаций на 9 гаплотипов
7/9/0.046=17х25=425 лет назад - 1575 г.

Ошибка на 50 лет и снова в сторону увеличения rolleyes.gif
Но при этом мутации по отношению к модальному, а не предковому, выведенному исходя из родословной.

Но на 12 маркерах на все 9 гаплотипов всего 1 мутация

Вы не указали, скольки-маркерные гаплотипы. То, что Вы взяли 0.046, указывает, что там 25-маркерные. Тогда действительно, примерно 1575-й год (точнее, 1583, если быть точным, округлять будем потом). Отклонение 42 года, или 9.9%. На мой взгляд, совпадение блестящее. Особенно если учесть, что Abt означет "about", то есть "примерно", "приблизительно".

Вы хотите, чтобы получилось 15.3 поколения, а не 16.9 (так на самом деле получается), и исправить скорость с 0.046 на 0.051. Так? Вы уверены, что это решит проблемы датировок? Хорошо, возьмите сотню генеалогий и прочих проверенных дат, и если 0.051 даст систематически более совпадающие даты, я с удовольствием исправлю, и другим посоветую. Но вот незадача, я взял первую пару, и уже энтузиазм не тот. Первые - Мак-Доналды. Там 60 25-маркерных гаплотипов (60, а не 9, так?), на все 69 мутаций. Получаем: 69/60/0.051 = 22.5 поколений вместо известных 26. А если 69/60/0.046 = 25 поколений. Видите, даже недобор. А если учесть, что там 18 базовых, то ln(60/18)/0.046 = 26 поколений. То, что доктор прописал. Так что в этом случае 0.046 - лучше.

Далее, в последнем номере Вестника я привел пример расчета 25-маркерных гаплотипов. Мне прислали 8 гаплотипов, в них было всего три мутации. Значит, имеем 3/8/0.046 = 8.15 поколений (я умышленно пока не округляю), то есть 204 года до общего предка. А по остаточным базовым гаплотипам ln(8/5)/0.46 = 10.2 поколений, или 255 лет до общего предка. То есть имеем 1753-1804 годы. На самом деле, как мне с восторгом сообщили, предок родился в 1767 году.

А если применить скорость 0.051, то получим 7.35 и 9.22 поколений, или 184 и 231 год, то есть 1777-1824 годы. Строго говоря, разницы практически никакой, поскольку сын его родился в 1797 году.

Ну и что, стоит менять?
Yurgan
Цитата(aklyosov @ 10.7.2008, 0:56) *
Вы не указали, скольки-маркерные гаплотипы. То, что Вы взяли 0.046, указывает, что там 25-маркерные. Тогда действительно, примерно 1575-й год (точнее, 1583, если быть точным, округлять будем потом). Отклонение 42 года, или 9.9%. На мой взгляд, совпадение блестящее. Особенно если учесть, что Abt означет "about", то есть "примерно", "приблизительно".

Вы хотите, чтобы получилось 15.3 поколения, а не 16.9 (так на самом деле получается), и исправить скорость с 0.046 на 0.051. Так? Вы уверены, что это решит проблемы датировок? Хорошо, возьмите сотню генеалогий и прочих проверенных дат, и если 0.051 даст систематически более совпадающие даты, я с удовольствием исправлю, и другим посоветую. Но вот незадача, я взял первую пару, и уже энтузиазм не тот. Первые - Мак-Доналды. Там 60 25-маркерных гаплотипов (60, а не 9, так?), на все 69 мутаций. Получаем: 69/60/0.051 = 22.5 поколений вместо известных 26. А если 69/60/0.046 = 25 поколений. Видите, даже недобор. А если учесть, что там 18 базовых, то ln(60/18)/0.046 = 26 поколений. То, что доктор прописал. Так что в этом случае 0.046 - лучше.

Далее, в последнем номере Вестника я привел пример расчета 25-маркерных гаплотипов. Мне прислали 8 гаплотипов, в них было всего три мутации. Значит, имеем 3/8/0.046 = 8.15 поколений (я умышленно пока не округляю), то есть 204 года до общего предка. А по остаточным базовым гаплотипам ln(8/5)/0.46 = 10.2 поколений, или 255 лет до общего предка. То есть имеем 1753-1804 годы. На самом деле, как мне с восторгом сообщили, предок родился в 1767 году.

А если применить скорость 0.051, то получим 7.35 и 9.22 поколений, или 184 и 231 год, то есть 1777-1824 годы. Строго говоря, разницы практически никакой, поскольку сын его родился в 1797 году.

Ну и что, стоит менять?


А были ли в Вашей выборке МакДугаллы, МакАлистеры и МакДонеллы?

Clan MacDougall is a Scottish clan traditionally associated with the lands of Argyll and Lorn in Scotland. Like the Clan Donald or MacDonald and all of its MacDonald branches, the MacDougalls are also descended from the King Somerled. The clan takes its name from Dougall, a son of Somerled, who, after his father's death in 1164, held most of Argyll and also islands such as the Isle of Mull, Lismore, Jura, Tiree, Coll and many others. Likewise the Clan MacDonald of Clan Ranald branch take their name from another of King Somerled's sons called Ranald and the head Clan Donald take their name from Somerled's grandson and Ranald's son who was called Donald.


Может ли такое произойти, что слишком большое количество Макдональдов по отношению к МакАлистерам и МакДоннелам перетянет на себя одеяло?
Например, имее трех братьев. Потомство каждого из них имеет фамилии. Количество известных гаплотипов потомков одного из братьев превышает количество гаплотипов потомков других, и при этом, потомки первого происходят не непосредственно от него, а от его правнука. Перетянут ли потомки первого на себя одеяло при определении возраста предка?
Не наблюдается ли закономерность, что чем дальше вглубь веков, тем дата предка при определении по количеству мутаций уходит глуюже реальной даты, а при приближении к нам, наоборот, ближе к нам?
Т.е. совершенно обратно тому, что должно происходить при учете возвратных мутаций.

aklyosov
Уважаемый Jurgan,

Вы не обижайтесь, но голословные рассуждения вот такого рода несерьезны. Так нельзя. Во-первых, Маклоналдами занимается целая группа специалистов, больше 70 человек сдали свои тесты, Даг Маклоналд - видный специалист по ДНК-генеалогии. Вы хотите сказать, что одной левой всех их затыкаете за пояс? Да они свои мутации изучили как никто. Таблицы отдельные по ним составили, доступны в сети.

Во вторых - опять смешны Ваши рассуждения на эту тему. Калибровка по Мак-Доналдам в значительной степени подтверждены скоростями мутаций по отдельным маркерам, а уж на первых 12 маркерах совпадение практически абсолютное. Если бы был сдвиг, такого совпадения бы не было.

Я уже устал повторять, что эти призывы к пересмотру системы без владения фактическим материалом, без глубокого изучения вопроса, без детального анализа и сравнения ДО публичных призывов и обсуждений производят тягостное впечатление. Хотите серьезно - напишите глубокую статью в Вестник, в которой проведите глубокий анализ этого вопроса, покажите расчеты, дайте много примеров, из которых станет ясно, что менять и зачем, и что конкретно это даст. Тогда это будет достойно обсуждения. А так - детский сад. Извините.
Yurgan
Уважаемый aklyosov.

Хорошо, посчитаю. Собственно, нет в этом ничего сложного. Могу же я развлечься. Эта скорость нужна мне, мне пользоваться. Можно выбрать среднюю. Вы же не поверили на слово Животовскому. А мои расчеты только подтверждают Ваши и не более. и метд все равно Ваш.
Или Даг МакДональд точно так же считал?
aklyosov
>Вы же не поверили на слово Животовскому.

Уважаемый Yurgan,

Это не так сформулировано. Я не призывал к пересмотру его коэффициента. Там нечего пересматривать. Но я внимательно прочитал его работы на этот счет, проанализировал его концепцию, перерассчитал то, что он рассчитывает, по другому, понял, где проходит граница применимости его метода, осознал, когда стоит применять его метод, и когда не стоит, сделал сводную таблицу разных методов, куда помещены результаты, полученные его способом, и опубликовал эту таблицу в Вестнике. Речь, как Вы видите, не шла о "перекалибровке", о "подправлении" его коэффициента. Речь шла о его непригодности там, где его применяют.

Просто я постоянно возвращаюсь здесь к положению, что надо создавать новые концепции, а не заниматься возней типа с подправлением коэффициентов. Международный форум по ДНК-генеалогии уже две недели гудит, обсуждая мою методику расчетов, там даже ветку создали под названием Anatole's method. И приходится держать оборону будь здоров, потому что много людей, не имея понятия о принципах расчета, сразу выносят вердикт. Приходится терпеливо разъяснять опять и опять. Но пик непринятия уже, похоже, прошел, маятник пошел в другую сторону.

К чему это я? А к тому, что гудел бы форум, если бы кто объявил, что подправил коэффициент скорости на 11%? Да кого это будет волновать? Да и кто бы этому вообще поверил? Я же принес туда четыре положения - (1) счет скоростей по логарифмической формуле, без подсчета мутаций; (2) сравнение логарифмического результата с мутационным для выяснения "чистоты" выборки; (3) счет не по индивидуальным маркерам, а блоками, вплоть до 67-маркерных блоков; и (4) константы скорости мутаций - 0.0096, 0.024, 0.046, 0.09 и 0.145 (для 6-, 12-, 25-, 37- и 67-маркерных гаплотипов). Ну, и как следствие -возможность более надежных расчетов, с демонстрацией на многих примерах.

Вот поэтому и загудели.

Вот сделайте цельную концепцию о расселении гаплогруппы N в Сибири и Европе (и в Америках), и тоже загудят. Чего Вам и желаю. На подправлении коэффициентов (что ОЧЕНЬ непросто по-настоящему обосновать) вклада не сделаете. Потому что это ровным счетом ничего нге изменит.
Yurgan
Цитата(aklyosov @ 10.7.2008, 20:37) *
>Вы же не поверили на слово Животовскому.

Уважаемый Yurgan,


К чему это я? А к тому, что гудел бы форум, если бы кто объявил, что подправил коэффициент скорости на 11%? Да кого это будет волновать? Да и кто бы этому вообще поверил? Я же принес туда четыре положения - (1) счет скоростей по логарифмической формуле, без подсчета мутаций; (2) сравнение логарифмического результата с мутационным для выяснения "чистоты" выборки; (3) счет не по индивидуальным маркерам, а блоками, вплоть до 67-маркерных блоков; и (4) константы скорости мутаций - 0.0096, 0.024, 0.046, 0.09 и 0.145 (для 6-, 12-, 25-, 37- и 67-маркерных гаплотипов). Ну, и как следствие -возможность более надежных расчетов, с демонстрацией на многих примерах.

Вот поэтому и загудели.

Вот сделайте цельную концепцию о расселении гаплогруппы N в Сибири и Европе (и в Америках), и тоже загудят. Чего Вам и желаю. На подправлении коэффициентов (что ОЧЕНЬ непросто по-настоящему обосновать) вклада не сделаете. Потому что это ровным счетом ничего нге изменит.

Полностью с Вами согласен, но я хочу научиться считать время жизни общего предка и понять систему, и мне так проще. Со многими Вашими положениями я соглсился, когда сам пересчитал. И я не ставлю задачи внести вклад, тоолько научиться считать, потому что 11% - это действительно ничего, но мне надо росчитать время жизни народов и о выбрать оптимальные варианты расчетов.

И возможно, я неправильно подсчитываю количество мутаций.

Но Вы не ответили на мои вопросы.
Перетянет ли на себя гаплотипы массы близких родственников время предка, если считать это время совместно с их более отдаленными родственниками, но количество которых не велико, например 35:7? Или будет то же, что и при отношении 20:20
aklyosov
>И возможно, я неправильно подсчитываю количество мутаций.

Ну это-то не беда. Это легко поправимо. Правила подсчета подробно описаны в моей публикации в последнем номере Вестника (как на английском, так и на русском языках).

>Перетянет ли на себя гаплотипы массы близких родственников время предка, если считать это время совместно с их более отдаленными предками, но количество которых не велико, например 35:7? Или будет то же, что и при отношении 20:20

В таком виде вопрос не имеет решения, потому что не определено, что такое "близкие родственники"?

Строго говоря, при научном составлении выборок тесты не проводят у родственников до третьего (иногда четверного) колена, и надо, чтобы люди жили на данной территории тоже не менее трех-четырех поколений. Если "близкие родственники" не ближе этого критерия, то все в порядке.

Надо просто держать в голове одно простое правило. Ищется не какой-то абстрактный "общий предок", а общий предок ЛЮДЕЙ, ЧЬИ ГАПЛОТИПЫ ПРЕДСТАВЛЕНЫ В ВЫБОРКЕ. Кто в выборке - того и общий предок. Поэтому если в выборке только близкие родственники - общий предок будет именно их.
wertner
Цитата(Yurgan @ 10.7.2008, 21:16) *
Перетянет ли на себя гаплотипы массы близких родственников время предка, если считать это время совместно с их более отдаленными родственниками, но количество которых не велико, например 35:7? Или будет то же, что и при отношении 20:20

Отвечу за Анатолия, как я понимаю его точку зрения smile.gif
Да, гаплотипы массы близких родственников могут перетянуть на себя время предка. Именно для проверки, что такого не произошло и надо проводить
Цитата(aklyosov @ 10.7.2008, 18:37) *
(1) счет скоростей по логарифмической формуле, без подсчета мутаций; (2) сравнение логарифмического результата с мутационным для выяснения "чистоты" выборки;


Ведь, "гаплотипы массы близких родственников" будут иметь больше базовых (т.е. одинаковых) гаплотипов и счет по логарифмической формуле по всей выборке даст другой результат, чем подсчет возраста предка по количеству мутаций в выборке.
В случае если выборка равномерна, то счет по обеим формулам даст близкий результат.

aklyosov, поправьте меня, пожалуйста, если неправильно понимаю Вашу точку зрения.
VovaN
Уважаемый Yurgan,
Надо найти метод правильно разделять ветви и находить их предковые гаплотипы. Иначе постоянно будут возникать перекосы в подсчете возраста выборки.
Clavis
Цитата(aklyosov @ 8.7.2008, 19:20) *
Уже ясно, что 6- и 12-маркерные средние скорости менять нельзя, они уже жестко завязаны на скорости индивидуальных маркеров.

Совершенно согласен, я лишь пытаюсь эти скорости разобрать на составляющие. Способ первый. Дисперсия для каждого маркера пропорциональна скорости мутации. Но выборка по каждой гаплогруппе искажена демографическими взрывами и бутылочными горлышками, ранними мутациями и прочими факторами, омрачающими математически стройную модель. Я взял 17 гаплогрупп (и больших субкладов) и посчитал дисперсию в каждой, а потом усреднил. Это левая диаграмма. В ее основе 66454 гаплотипа (реально много меньше, потому что многие одновременно принадлежат двум- трем гаплогруппам - матрешкам: R1-R1b-R1b1 и поэтому сосчитаны два-три раза)
Другой путь - взять все гаплогруппы (ведь все они восходят к Адаму, то есть это одна супер-гаплогруппа) и посчитать дисперсии маркеров. В обоих случаях база FTDNA, в последнем случае все 33416 гаплотипов.Правая диаграмма.

wertner
Хотелось бы соотношение скоростей цифрами smile.gif

Давайте сверимся.

Мои соотношения (обратно пропорциональны скоростям; посчитаны по количеству мутаций в сети Network по 10 гаплогруппам и большим субкладам):
10 6 7 9 6 4 107 14 5 7 21 4

Скорости Чандлера:
0,00076 0,00311 0,00151 0,00265 0,00226 0,00226 0,00009 0,00022 0,00477 0,00186 0,00052 0,00242
Clavis
Цитата(wertner @ 12.7.2008, 2:51) *
Хотелось бы соотношение скоростей цифрами smile.gif

Давайте сверимся.



Скорости Чандлера:
0,00076 0,00311 0,00151 0,00265 0,00226 0,00226 0,00009 0,00022 0,00477 0,00186 0,00052 0,00242

Мои скорости, как на правой диаграмме, то есть по мировому древу, средняя скорость по Клесову (здесь 389/2 -длинная- а не 389/II -короткая; полагаю, у Вас также)
0,00072
0,00198
0,00124
0,00074
0,00556
0,00410
0,00053
0,00231
0,00149
0,00081
0,00240
0,00211
Ваши скорости в нижней строке (я привел их в сопоставимый вид: от обратной скорости перешел к прямой и привел среднюю скорость по Клесову):


0,00145 0,00241 0,00207 0,00161 0,00241 0,00362 0,00014 0,00103 0,00289 0,00207 0,00069 0,00362













Clavis
наконец, если у меня 389/2 = 0,00211 то 389/II =0,00119

теперь скорости по 46000 примерно гаплотипам YSearch
0,00072 0,00203 0,00122 0,00074 0,00537 0,00414 0,00053 0,00234 0,00144 0,00088 0,00237 0,00222
aklyosov
Я не очень понял, о чем дискуссия. Дело в том, что при суммировании десятков тысяч мутаций по всем ("чохом") гаплотипам YSearch заведомо получатся неверные скорости мутаций индивидуальных маркеров. А причина все та же, которая преследует ДНК-генеалогию уже больше 10 лет: смешиваются старые и молодые предки. От молодых общих предков мутаций пока немного, их гаплотипы похожи друг на друга. От старых предков мутаций много. Когда берутся все эти десятки тысяч гаплотипов и суммируются, получается средняя температура по больнице.

Поэтому просто показывать эти таблички друг другу не имеет большого смысла. Их нужно проверять. А именно, взять тех же Мак-Доналдов, 68 гаплотипов (сейчас, наверное, уже больше) и по 12, 25, 37 и 67 маркерным гаплотипам показать, по всем этим индивидуальным скоростям, сколько поколений от общего предка. Если по всем 12-, 25, 37- и 67-маркерным гаплотипам получится именно 26 поколений до предка, тогда дело сделано. Без этого - можно обсуждать до скончания века.

wertner
Я немного откорректировал скорости, чтобы по формуле P12 = 1 - (1-p1)*(1-p2)*...*(1-p12) получалось 0.024 (чтобы использовать формулу сложения вероятностей, а не арифметическое сложение). Такую корректировку я провел для Ваших и своих скоростей. Кроме того, перевел наши с Вами скорости 389-2 в скорость 389ii по формуле p12'=1-(1-p12)/(1-p10).

Итого получилось (Chandler, Clavis-YSearch, Clavis-мировое древо, werner):
0,00076 0,00311 0,00151 0,00265 0,00226 0,00226 0,00009 0,00022 0,00477 0,00186 0,00052 0,00242
0,00073 0,00205 0,00123 0,00075 0,00543 0,00418 0,00054 0,00236 0,00146 0,00089 0,00240 0,00135
0,00073 0,00200 0,00125 0,00075 0,00562 0,00415 0,00054 0,00234 0,00151 0,00082 0,00243 0,00131
0,00146 0,00244 0,00209 0,00163 0,00244 0,00366 0,00014 0,00104 0,00293 0,00209 0,00070 0,00157

Цитата(aklyosov)
Дело в том, что при суммировании десятков тысяч мутаций по всем ("чохом") гаплотипам YSearch заведомо получатся неверные скорости мутаций индивидуальных маркеров. А причина все та же, которая преследует ДНК-генеалогию уже больше 10 лет: смешиваются старые и молодые предки. От молодых общих предков мутаций пока немного, их гаплотипы похожи друг на друга. От старых предков мутаций много. Когда берутся все эти десятки тысяч гаплотипов и суммируются, получается средняя температура по больнице.

Я как раз разделяю предков.
Clavis
Цитата(aklyosov @ 12.7.2008, 10:09) *
Я не очень понял, о чем дискуссия. Дело в том, что при суммировании десятков тысяч мутаций по всем ("чохом") гаплотипам YSearch заведомо получатся неверные скорости мутаций индивидуальных маркеров. А причина все та же, которая преследует ДНК-генеалогию уже больше 10 лет: смешиваются старые и молодые предки. От молодых общих предков мутаций пока немного, их гаплотипы похожи друг на друга. От старых предков мутаций много. Когда берутся все эти десятки тысяч гаплотипов и суммируются, получается средняя температура по больнице...

Анатолий Алексеевич, так абсолютную скорость я и не пытаюсь найти - Вы это сделали за меня. Я ищу соотношение скоростей. Конечно, в каждой гаплогруппе найдутся маркеры, которые "ускорились" от демографического взрыва молодого рода (если у основателя молодого рода аллель - из облака мутаций, дисперсия в гаплогруппе подскочит), и маркеры, которые "замедлились", потому что у основателя молодого рода в этом маркере была та же аллель, что и у основателя гаплогруппы, и дисперсия окажется занижена. По этой причине в каждой отдельно взятой гаплогруппе соотношение "кажущихся" скоростей получается индивидуальным, отличным от других гаплогрупп. Когда объединяем много гаплогрупп вместе (лучше, если все), то этот разнобой в значительной степени компенсируется. Это тот же эффект объединения, который Вы используете, объединяя мутации в 6, 12, 25 и т.д. маркерах: плюсовые и минусовые ошибки взаимоуничтожаются, как демоны в эпоху Ивана Васильевича, менявшего профессию.
Не идеально, согласен. Остается утешаться: на безрыбье и рак – рыба, за неимением гербовой пишем на простой…
aklyosov
>Кроме того, перевел наши с Вами скорости 389-2 в скорость 389ii

А смысл?

Меня, признаться, удивляет озабоченность многих людей тем, что надо для расчетов применять именно 389b, а не 389-2. Просто непременно, а то получится неправильно.

Я обычно спрашиваю - а вы-то сами сравнивали? Желательно на многих примерах. Но хотя бы на одном - сравнивали? Ну, и какая ошибка получается?

Ответ ВСЕГДА такой - нет, не сравнивал. Но так вроде считается. Все говорят.

Цирк.

Один сегодня мне шесть писем подряд написал по этому поводу. Очень озабоченный этим маркером. Очень переживал, что я 389-2 использую. Я ему пять раз отвечал, что я калибровал именно под 389-2. Что скорости мутаций, те самые 0.024, 0.046, 0.09, 0.145 - они все для DYS389-2. Что мутации все равно суммируются. Что это не имеет совершенно никакого значения, какой маркер использовать, если калибруется.

А он все пишет и переживает.

Плюнул я и посчитал для него на большой выборке гаплотипов двумя способами. Оказалось, что отклонение в числе поколений до общего предка 0.4% и 0.7%, для двух выборок.

Он мне написал, благодарил, что, наконец, понял, что разница в самом деле невелика.
aklyosov
>Итого получилось (Chandler, Clavis-YSearch, Clavis-мировое древо, werner):
0,00076 0,00311 0,00151 0,00265 0,00226 0,00226 0,00009 0,00022 0,00477 0,00186 0,00052 0,00242
0,00073 0,00205 0,00123 0,00075 0,00543 0,00418 0,00054 0,00236 0,00146 0,00089 0,00240 0,00135
0,00073 0,00200 0,00125 0,00075 0,00562 0,00415 0,00054 0,00234 0,00151 0,00082 0,00243 0,00131
0,00146 0,00244 0,00209 0,00163 0,00244 0,00366 0,00014 0,00104 0,00293 0,00209 0,00070 0,00157

Уважаемый Wertner, мою точку зрения Вы на это знаете. Все эти цифры не стоят той виртуальной бумаги, на которой написаны, без глубокого доказательства на многих примерах, что они (а) достоверны, и (б) лучше, чем у других, опубликованных.

А показать и доказать (а) и (б) - это гигантская работа. И стоит подумать - а нужно ли ее проводить, когда она и так проводится десятками людей, которых уже ничем не удивить по части этих величин. Много людей определяют эти величины напрямую, в тысячах пар отец-сын, по разным гаплогруппам. Вы хотите их чему-то научить?

Почему не взять цифры того же Чандлера, или Мак-Доналдов, и не показать на многих примерах, на калибровках, какие исправления надо внести? Только показать предметно, на примерах. Зачем изобретать велосипед, да еще без детального сравнения с уже известным?

Дело, конечно, Ваше, но Вы уверены, что это и есть самое приоритетное направление, на которое стоит положить жизнь? Особенно когда этим занимаются те самые десятки людей?

Я буду раз оказаться неправ, и что Вы станете мировой знаменитостью в отношении определения скоростей мутаций индивидуальных маркеров. Буду искренне рад. Главное, чтобы Вы в это верили.
Clavis
Цитата(aklyosov @ 13.7.2008, 11:04) *
>Кроме того, перевел наши с Вами скорости 389-2 в скорость 389ii

А смысл?
Меня, признаться, удивляет озабоченность многих людей тем, что надо для расчетов применять именно 389b, а не 389-2. Просто непременно, а то получится неправильно.

Кого-кого, а меня это так сильно не заботит. Единственно, надо заранее предупреждать, какой из вариантов использован, а то получается: один меряет расстояние от торца линейки, а другой от цифры 0 немного правее и говорят: у нас немного не сходится.
/
Цитата(aklyosov @ 13.7.2008, 11:04) *
Плюнул я и посчитал для него на большой выборке гаплотипов двумя способами. Оказалось, что отклонение в числе поколений до общего предка 0.4% и 0.7%, для двух выборок.

Простите за любопытство, в одном случае использована средняя скорость 0,002 мутаций/поколение/маркер=0,024мутаций/поколение/панель, а в другом?
Clavis
Цитата(aklyosov @ 13.7.2008, 11:19) *
А показать и доказать (а) и (б) - это гигантская работа. И стоит подумать - а нужно ли ее проводить, когда она и так проводится десятками людей, которых уже ничем не удивить по части этих величин. Много людей определяют эти величины напрямую, в тысячах пар отец-сын, по разным гаплогруппам. Вы хотите их чему-то научить?

Пока что разбос значений у разных исследователей пар отец-сын (я сужу по опубликованным на нашем форуме) весьма велик, значит, статистика маловата. Второе, что смущает: большие расстояния между отцом и сыном (два, три, четыре шага) встречаются подозрительно часто, не по теории вероятности. Не подпортили ли результаты случаи ложного отцовства? А ведь тут ложка дегтя (недостоверного отцовства) портит бочку меда.
Мне посчитать дисперсию стоило несколько минут, далее я свои относительные скорости умножил на абсолютную скорость по 12 маркерам, которая Анатолию Алексеевичу, безусловно, стоила большого труда.
Так что мы просто сверяем результаты, полученные разными путями. Прикидываем доверительныйинтервал
aklyosov
>Кого-кого, а меня это так сильно не заботит. Единственно, надо заранее предупреждать, какой из вариантов использован, а то получается: один меряет расстояние от торца линейки, а другой от цифры 0 немного правее и говорят: у нас немного не сходится.

Ну, это ясно. Хотя обычно видно из самих гаплотипов, стоит 30 или 17 на месте 389-2 (или близкие к ним цифры). Но самое смешное, что и это обычно неважно, см. ниже.

>Цитата(aklyosov @ 13.7.2008, 11:04) Плюнул я и посчитал для него на большой выборке гаплотипов двумя способами. Оказалось, что отклонение в числе поколений до общего предка 0.4% и 0.7%, для двух выборок.
>Простите за любопытство, в одном случае использована средняя скорость 0,002 мутаций/поколение/маркер=0,024мутаций/поколение/панель, а в другом?

Так те же 0.046 и 0.09 и использовались (я считал по 25- и 37-маркерным гаплотипам) . Я сначала думал надо перекалибровать, а оказалась, что там разница в 2-4 мутации на несколько сот мутаций в целом.

Хотя можно и перекалибровать, для порядка, но суть все равно не изменится. Поэтому меня всегда забавляет эта суета вокруг скоростей мутаций - типа, ой, там REC случается, ошибка будет! - А вы смотрели, будет ли на самом деле ошибка? - Нет я не смотрел. Так наверняка будет же!

А оказывается, процент. - Ой, спасибо, кто бы мог подумать!

И вот таких активистов - пруд пруди.

Кстати, как Вы знаете, это зачастую иллюзия, что в 389-2 намного больше мутаций, чем в 389b. Если 389-2 имеет 30, 31, и 32, то часто в 389-1 одно и то же число, например, 13. И тогда те три мутации в 389-2 эквивалентны тем же трем мутациям в 389b. И напротив, мутаций нет в 389-2, но они есть в 389b, но компенсируются мутациями в другую сторону в 389а. В итоге на самом деле разница в друх системах меньше, чем кажется на первый взгляд.
aklyosov
Вот, прервался, чтобы взглянуть на пример у славян. И так, и так получается 2 мутации (при использовании 389-2 и 389b). То есть разницы просто никакой. Кстати, на логарифмический способ это вообще не влияет, поскольку мутация в любом из 389-х выводит гаплотип из базовых.
aklyosov
>Пока что разбос значений у разных исследователей пар отец-сын (я сужу по опубликованным на нашем форуме) весьма велик, значит, статистика маловата.

Так и я именно об этом - что, нам нужно в это дело лезть? Улучшать статистику, которая ведется уже 15 лет, и немалыми силами? Это есть приоритетное направление "российской ДНК-генеалогии"?

Мне предствляется, это болезни роста. Это напоминаето известный анекдот про поиски часов под фонарем, потому что там светлее.

Столько много интереснейших проблем с российской историей гаплогрупп и гаплотипов, с мировой древнейшей историей вообще, с семейными историями, в конце концов, так нет - берется избитая-перебитая проблема, которой не занимается только ленивый на Западе, и принимается за приоритетную (!).

>Второе, что смущает: большие расстояния между отцом и сыном (два, три, четыре шага) встречаются подозрительно часто, не по теории вероятности. Не подпортили ли результаты случаи ложного отцовства? А ведь тут ложка дегтя (недостоверного отцовства) портит бочку меда.

Не исключено. Причем, возможно, и родственники. Вы же знаете гнилую мораль в странах желтого дьявола! laugh.gif

А скорее всего так и есть, порой скачут мутации. Но, думаю, в пределах ошибки расчетов.

>Так что мы просто сверяем результаты, полученные разными путями. Прикидываем доверительныйинтервал.

Еслт честно, я пока не видел конкретных рекомендаций, проверенных на многих реальных примерах. Вот это и будет огромный труд.
АнТюр
[size="3"][/size]Уважаемые господа, здравствуйте!


Посмотрел Ваш сайт и форумы. Мне понравилось. Попробую Здесь прижиться.



Пока меня интересует два вопроса. Но сначала мой конспект (вернее мое понимание) процедуры калибровки скоростей мутвций.




Конспект

>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

«Калибровка скорости мутаций» является одним из понятий современной ДНК-генетики. Формально, это простейшая операция. Имеется некоторая выборка людей, для которых известно время жизни их прародителя. Например, живущие сегодня мужчины клана Макдональдов знают время жизни его основателя. Значит, по суммарному количеству мутаций в их гаплотипах можно рассчитать скорость мутации. Как мы поняли, скорость мутаций, рассчитанная «по Макдональдам», является сегодня одной из наиболее популярных при выполнении ДНК-генетических реконструкций. Автор публикации [Клёсов, 2007] откалибровал скорость мутаций по генетическим данным, характеризующим евреев. Их единый прародитель по мужской линии - Авраам, жил в соответствии с Библейской историей 3600 лет назад. По выборке генетических данных, характеризующих евреев, выделены его прямые потомки. Их оказалось 200 человек из 399. Общее количество мутаций, относительно гаплотипа Коэна (гаплотипа Авраама) составило 270. Количество мутаций на одного человека – 1,35. Это на шестимаркерный гаплотип. В пересчете на 1 маркер эта цифра составит 0,225. Для того, чтобы рассчитать скорость мутаций, надо задать длительность одного поколения. Возьмем 30 лет. Получаем 120 поколений. Скорость = 0,225[мутаций на маркер]/120[поколений]= 0,001875[мутаций на маркер на поколение]. Если мы возьмем длительность поколения 25 лет, то соответственно, скорость мутаций составит 0,001563.

Датируем на основе скорости мутаций 0,001563, например, палестинских арабов. Для них имеем всего 97 мутаций на 63 человека. Это соответствует 0,257 мутациям на один маркер на одного человека. Количество поколений = 0,257/0,001563 = 164,4. Дата жизни прародителя палестинских арабов 4110 лет назад. Эту же цифру мы получим и в том случае, если длительность поколения будет равна 30 лет, и соответственно, скорость мутаций 0,001875. Понять это легко. При таком способе расчета параметр «длительность поколений», применяемый при расчете даты общего предке, является фиктивным. Скорость мутаций является функцией от параметра «длительность поколений». Значит, она тоже является фиктивным параметром. Другими словами, мы можем задать длительность поколения, например, в 1 год, 1 день или 1 минуту. Это ни как не отразится на дате общего предка. Если эти два параметра фиктивные, то дату общего предка можно рассчитать и без них. Для выборки «Евреи» цифра 1,35 соответствует 3600 годам до Авраама. Для палестинских арабов эта цифра составляет 1,54. Простая пропорция дает нам 4110 лет назад. Способ получения последней цифры раскрывает ее операционный смысл. Она «завязана» не просто на Библейскую историю, но на ту ее часть, которая не подтверждена какими либо независимыми данными. Это относится ко всем датам прародителей социальных общностей, которые рассчитаны с применением скорости мутаций, калиброванной на Авраама. Это же относится и ко всем ДНК-генетическим реконструкциям, выполненным с учетом дат прародителей. Попросту говоря, даты прародителей и реконструкции не соответствуют критерию научности. Зато они вполне соответствуют критериям Библейской истории. Можно рассчитать коэффициент Авраама: 3600/1,35 = 1667 лет. Это и есть квинтэссенция процедуры калибровки скорости мутаций на некий персонаж. Для расчета времени жизни прародителя, достаточно число мутаций умножить на коэффициент Авраама.

Расчеты времени жизни прародителей социальных общностей можно выполнять на основе скорости мутаций, оцененной по парам отец-сын. Эта скорость является независимой, ни от представлений клана Макдональдов о времени жизни их единого предка, ни от Библейской истории, ни от каких либо других частных или общих представлений о прошлом Человечества.

>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>



Два вопроса.

1. Этот сайт и форумы являются научными или религиозными? Если они научные, то Библейскому Аврааму здесь не место. Если сайт и форумы религиозные, то здесь не место мне.

2. В чем смысл замены скорости мутаций, оцененной по парам отец-сын, на «калиброванную скорость»? Первая – независимый параметр, вторая – зависимы.



Спасибо.
Пастор
Цитата(АнТюр @ 25.7.2008, 6:36) *
1. Этот сайт и форумы являются научными или религиозными? Если они научные, то Библейскому Аврааму здесь не место. Если сайт и форумы религиозные, то здесь не место мне.


biggrin.gif Сразу же видно, что мы секта. ДНК-аум-сенрикё, вступайте в наши ряды.
wertner
Цитата(АнТюр @ 25.7.2008, 7:36) *
1. Этот сайт и форумы являются научными или религиозными? Если они научные, то Библейскому Аврааму здесь не место. Если сайт и форумы религиозные, то здесь не место мне.
[/font]

Скорее, любительски-научные. До научного нам еще расти и расти, имхо :-) (это если рассматривать нас как сообщество, а отдельные люди, например, aklyosov уже доросли)
aklyosov использует и калибровку по Макдональдам.

Цитата(АнТюр @ 25.7.2008, 7:36) *
2. В чем смысл замены скорости мутаций, оцененной по парам отец-сын, на «калиброванную скорость»? Первая – независимый параметр, вторая – зависимы.

За всех говорить не буду, но мне замена скорости мутаций, оцененной по парам отец-сын, на «калиброванную скорость» нужна для применения моих методов оценки времени жизни предка. Как раз причина зависимости "калиброванной скорости" от метода оценки времени жизни предка помогает потом скорректировать в обратную сторону оценку времени жизни предка других выборок.

Кроме того, в первом посте на этой странице Clavis уже писал:
Цитата(Clavis @ 13.7.2008, 9:01) *
Пока что разбос значений у разных исследователей пар отец-сын (я сужу по опубликованным на нашем форуме) весьма велик, значит, статистика маловата.

aklyosov
Уважаемый АнТюр,

В Вас сразу видно плохо информированного новичка, который тут же на скаку смешивает самые разные понятия, и с горячей категоричностью (или категоричной горячностью?) начинает размахивать сабелькой.

Как Вы понимаете, этой фразой я Вас немного осаживаю. Не Вы первый, не Вы последний.

Конспект Ваш ужасающе неверный, и смешивает фрагменты из разных жанров. В итоге - нечто близкое к билиберде в рамках нашего форума.

По порядку. Про Авраама и 12 колен израилевых Вы взяли из другого жанра. Поэтому восклицать в стиле Вашего первого вопроса - это просто ошибиться дверью. Если будете продолжать в стиле "значит здесь не место мне" - возможно, Вы и правы.

Статья про 12 колен израилевых имела определенный жанр. Она была призвана поместить основные сведения ДНК-генеалогии в увлекательный контекст, и привлечь внимание широкой аудитории. Эта задача была выполнена. На сайтах на этот цикл - многие тысячи ссылок. Кто-то недавно насчитал 16 тысяч, и высказал убедительное предположение, что евреи мне за это хорошо платят. К сожалению, эти деньги, видимо, кто-то забирает. До меня они не доходят.

Второй "момент" - мне давно хотелось пересказать Библию с точки зрения ДНК-генеалогии. Я рассматриваю эти занятия как интеллектуальную игру. Как ни удивительно, но основные генеалогические положения Библии не противоречат основным выводам ДНК-генеалогии. Но ДНК-генеалогия их заметно дополняет. Для меня это тоже интеллектуальная игра. Занимаясь этим, я для себя узнал очень много нового из истории как евреев, так и славян, и взаимоотношения между ними. Если Вам это неинтересно - дело хозяйское, но причитать здесь по этому поводу - это демонстрировать ограниченность ума. Опять же, дело Ваше.

Третье - исходя из законов жанра, я показал то, как считаются мутации и поколения в КРАЙНЕ упрощенном виде. То, что Вы законспектировали - неверно. Надо считать по возможности по значительно более протяженым гаплотипам (я обычно использую 25-маркерные, иногда - 37- и 67-маркерные), их специально калибровать, и вносить поправки на возвратные мутации. Естественно, в популярной статье про колена израилевы я этого не касался. Цель была другой.

>В чем смысл замены скорости мутаций, оцененной по парам отец-сын, на «калиброванную скорость»? Первая – независимый параметр, вторая – зависимы.

На этот вопрос я Вам отвечу, когда Вы переварите то, что сказано выше. После переваривания попробуйте переконспектировать, потом прочитать хотя бы пару статей по определению скорости мутаций по парам отец-сын, потом понять, что такое "калиброванная скорость", потом постучать в дверь, и без того апломба задать вопрос - либо в том же виде, либо уже (скорее всего) перефразированный. А может, к тому времени и сами поймете.

Удачи.
aklyosov
Уважаемые коллеги,

Я разработал новую систему скоростей мутаций в гаплотипах. Она примерно соответстствует старым моим величинам, но в ее основе лежит новая философия.

И вот причина для пересмотра.

Когда я вышел со своей старой системой, основанной на калибровке по Мак-Данальдам, в международное сообщество ДНК-генеалогов, то встретил настороженное отношение к моим скоростям мутаций. Коротко, вот мои впечатления.

Во-первых, политической (дипломатической) ошибкой с моей стороны было то, что я не стал расшаркиваться, делать реверансы, и причитать о том, какие там все великие, а я вот провинциал, и всех дико уважаю. Точнее, это была не моя ошибка, а ИХ восприятие. Напротив, я (как они восприняли) просто объявил, что они все могут просто заткнуться, и делать, как делаю я. И тогда им всем будет счастье.

Естественно, ТАК они воспринять положительно просто не могли. Но поскольку 90% их просто не умеют считать мутации и переводить их в годА до общего предка, то они сразу устроили типа истерики, и объявили, что у меня "нонсенс". Почему нонсенс, пояснения не было. Это просто был протест против появления "новичка", который не стал делать реверансы. Я получил много персональных писем, в которых мне рассказывали, что это обычная обстановка на том форуме - новые идеи не любят, когда они исходят не от "патриархов", и истерики такого рода - это обычная форма защиты "стариков".

Но мне от этого было не легче.

Короче, я для себя еще раз понял, что любое новое нужно связывать со старым. чтобы был плавный переход.

Вторая причина в том, что я обнаружил, что Мак-Доналды - не лучший вариант для калибровки. Я калибровал тогда, когда у них было 60 гаплотипов. Тогда все было замечательно. Потом у них добавилось 8 гаплотипов, стало 68, и калибровка стала хуже. Теперь добавились еще, и калибровка стала еще хуже. Я не могу публично и в статьях мотивировать тем, что надо использовать старый состав Маков, а с новым калибровать не надо. Это - несерьезно.

Я стал думать над тем, как примирить литературные данные по скоростям мутаций, калибровки, мои старые данные (я же вижу, что они в принципе правильные), и чехарду с невоспроизводимостью маркеров по второй панели, в частности, маркерами 459a,b и 464a,b,c,d. По ним идет непрерывная дискуссия, конца которой нет. Дело в том, что эти маркеры (или некоторые из них) сцеплены, и не являются независимыми (как и 389-1, -2 в принятом формате). Одни эти маркеры исключают, другие считают, что исключать нельзя. В итоге, сделать так, чтобы все были довольны, просто невозможно.

Встревать в эти дискуссии я не считаю целесообразным. Ясно, что конца им нет, и приемлемое решение не будет найдено. Все эти дискуссии идут по типу "ты меня уважаешь?".

Вот такая проблема встала передо мной в полный рост. И вот какой выход я нашел.

Первое - я заключил, что надо привязаться к таблице мутаций Чандлера. Она - признана, он - авторитет, это будет тот самый плавный переход от литературы, и что главное - моя калибровка с первой 12-маркерной панелью практически совпадает.

Так что я взял для первой 12-маркерной панели как среднюю скорость мутаций - сумму скоростей мутаций Чандлера. Это (все в стотысячных долях) - 76, 311, 151, 265, 226, 226, 9, 22, 477, 186, 52 и 242. В сумме, округленно, 0.022 мутаций на 12-маркерный гаплотип на поколение, то есть 0.0018 на маркер в 12-маркерной панели (точнее, 0.00183, но я округляю). В моей калибровке было 0.024 мутаций на гаплотип, но разница между 0.024 и 0.022 - всего 8%, так что несущественно. Тем более что у Чандлера погрешность равна 0.022+/-0.004, что все равно включает мою бывшую калибровку.

Так что я принял среднюю скорость мутаций для первых 12 маркеров 0.0018 на маркер или 0.022 на гаплотип.

А для второй панели (маркеры 13-25), по которой сплошные и нерешаемые проблемы? Например, для семи маркеров величины скоростей там 16, 16, 99, 132, 135 (в стотысячных долях) и так далее, и вдруг - для каждого из четырех 464-х маркеров скорость равна 566, в сумме - 2264 (точнее, 0.02264), больше, чем все другие вместе взятые. То есть именно эти четыре сцепленных маркера и определяют якобы скорость. У Чандлера они вообще все четыре имеют одинаковую скорость, что неверно, как следует из любого списка мутаций по маркерам. То есть Чандрер сам плюнул и сдался, и написал для всех одинаковые скорости.

Как быть?

А вот как. Я взял и положил и для второй панели ту же самую скорость 0.0018 на маркер, что и для первой панели. То есть я фактически предложил не обращать внимание на все эти сцепленности, невоспроизводимости, и бесконечные дискуссии, и считать скорости одинаковыми как в 12-, так и в 25-маркерных гаплотипах. А все остальное - это причуды сцепленных маркеров, не отражающих временное расстояния до общего предка. Между прочим, 0.00183х25 = 0.046 мутаций на 25-маркерный гаплотип на поколение, и у меня по калибровкам раньше было 0.046. То же самое.

И вот что у меня в итоге получилось:

6-маркерные гаплотипы - 0.0016 на маркер, 0.0096 на гаплотип
12-маркерные - 0.0018 на маркер, 0.022 на гаплотип
25-маркерные - 0.0018 на маркер, 0.046 на гаплотип
37-маркерные - 0.0024 на маркер, 0.090 на гаплотип

На самом деле там 0.00183 и 0.00243, но я беру округленно.

Примеры расчетов общего предка (первая цифра по 12-маркерным гаплотипам, вторая - по 25-маркерным):

Англия - 4800 и 4775 лет
Шотландия - 4225 и 4300
Норвегия - 4325 и 4300
Россия и Украина - 4225 и 4475
Индия, Россия, Украина (объединенно) - 4275 и 4275
Чехия и Словакия - 3925 и 4200
Индия - 3925 и 3750

Как видно, по этим странам совпадение замечательное. Хотя - 12 и 25 маркеров в каждом случае, так что принципиально разные системы.

В некоторых случаях наблюдаются скачки. Но это уже означает, что дело - не в скоростях мутаций, а в особенностях мутаций по 12- и 25-маркерным гаплотипам. Например, Ирландия - 4550 и 5400 лет. Германия 4200 и 4825 лет. Это означает, что скоростями мутаций такие расхождения не примирить. Либо 12-маркерные в этих случаях дают заниженное число мутаций, либо 25-маркерные дают завышенное число. Я больше верю 25-маркерным, поскольку они дают большее число маркеров, и включают в себя 12-маркерные.

Так что прошу любить и жаловать новую систему, которая фактически есть старая, но с лучшим обоснованием.

Комментарии?



Clavis
поскольку система и ранее базировалась на скоростях, полученных в парах отец-сын, то какие могут быть возражения?
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2020 IPS, Inc.