Главная   |   Древние Рода   |   ДНК тесты   |   ДОК генеалогия             VK  |  OK  |  FB

Здравствуйте, гость ( Вход | Регистрация )



2 страниц V  < 1 2  
Ответить в данную темуНачать новую тему
> О сравнении пар 12-маркерных гаплотипов
Ostan
сообщение 5.9.2009, 9:52
Сообщение #21


Знаток
****

Группа:  R1a
Сообщений: 685
Регистрация: 22.9.2008
Пользователь №: 804



Анатолий Алексеевич. Для 67-маркерных гаплотипов ничего не изменится, если дисперсию определять из распределения Эрланга. А вот для 12-маркерных, где число мутаций меньше 5-6 много неясностей, на которые сможет ответить только специалист-математик, каковым я не являюсь.
Перейти в начало страницы
 
+Цитировать сообщение
Ostan
сообщение 5.9.2009, 13:18
Сообщение #22


Знаток
****

Группа:  R1a
Сообщений: 685
Регистрация: 22.9.2008
Пользователь №: 804



Впрочем, и для выборок 12-маркерных гаплотипов ничего не изменится, если в выборке больше 5-6 гаплотипов. Поскольку во всех статистических расчетах идет суммирование. Во всех остальных случаях специалисты дают, как правило, один ответ "это не считается, если надо- моделируй", что и пришлось мне однажды проделать.
Перейти в начало страницы
 
+Цитировать сообщение
aklyosov
сообщение 5.9.2009, 14:23
Сообщение #23


Легенда
************

Группа: R1a, Академики
Сообщений: 8858
Регистрация: 4.7.2008
Пользователь №: 526



Уважаемый Ostan,

Я задал простой вопрос:

Не могли бы Вы сформулировать основной вывод Ваших рассуждений в одной-двух строках? Ну, сравнили Вы два 12-маркерных гаплотипа, один из которых Ваш, и что является выводом? Я вижу много безотносительных слов, а - финальный вывод?

Я понимаю так, что основной вывод в данном случае - это то, что Вы скажете коллеге, чей гаплотип сравнивали со своим. Все остальное безотносительно. Итак, коллега сообщил Вам (или Вы ему), что первая панель совпала, на третьей - пять мутаций от его гаплотипа.

Я бы на месте коллеги спросил бы - а как насчет второй панели? Как можно даже не упоминать треть всей информации? Но по какой-то причине Вы предпочли эту информацию умолчать. Это в высшей степени странно (по моей оценке). Так не делают. Я понимаю, что Вы не математик, но это называется манипулированием данными. Или у Вас другое объяснение?

Итак, какие слова Вы скажете коллеге (о чем я и спрашивал)? Видимо, вот они:


При сравнении по первой панели, где у нас нет различий, на основании графиков или таблицы получаем: с вероятностью 90% генетическое расстояние меньше 1381 года, а с вероятностью 95%- меньше 1797 лет.

Сравнивая третьи панели, при допущении их эквивалентности первым, и исходя из того, что между гаплотипами 5 мутаций, получаем, что генетическое расстояние с вероятностью 90% больше 1400 лет, а с вероятностью 95% более 1100 лет.

Объединяя оба результата, и, учитывая двойное расстояние до общего предка, получаем окончательно с вероятностью 90% около 700 лет без доверительного интервала и с вероятностью 95% в интервале 550-900 лет до общего предка.


На месте коллеги я бы пожал плечами и отошел. Потому что у Вас здесь просто гроздь ошибок и непониманий.

Во-первых, как я уже отметил, Вы предпочли даже не упомянуть о второй панели. А если там тоже нет мутаций? А если только одна? А если десять мутаций? Вы что, полагаете, что это ничего не повлияет на Ваше заключение?

Во-вторых, Вы или не знаете, или не учитываете, что средние скорости мутаций по первой и третьей панели существенно различаются. Вы же пишете "при допущении из эквивалентности". Откуда такое "допущение" могло появиться, когда ИЗВЕСТНО, что они различаются? "Конечно, допущение об эквивалентности первой и третей панелей достаточно грубое". Оно не грубое, оно неверное.

В-третьих, что за безумные "графики или таблицы" Вы используете в первой фразе? Я понимаю, что Вы это откуда-то взяли, но Вы знаете, на основании чего они предложены? Откуда вообще могут появиться точности до одного (!) года, когда мутаций в панели вообще нет? Да хоть они и были бы - один год в точности, Вы понимаете, что это значит?

В-четвертых, вот это -

Столь высокая точность оценки времени жизни общего предка оказалась возможной из-за крайней неравномерности распределения мутаций по панелям.

- сущая ерунда.

Я скажу из деликатности стандартную фразу, что "Возможно, в Вашем предлагаемом методе что-то есть". Но если честно, я этого "что-то" просто не вижу. Это все равно, что Вы провели две серии бросков монеты. В одном случае четыре раза подряд выпала решка. В другом случае три раза выпал орел, и один раз решка. И Вы говорите, что эта "крайняя неравномерность" позволит с высокой точностью вычислить вероятность выпадания орла или решки. Вы понимаете, что это ерунда?

На самом деле то, что у вас с коллегой на первых 12 маркерах мутаций нет, говорит, что "расстояние" между вами менее, чем 1200+/-1200 лет. Иначе говоря, с вероятностью 95% ваш общий предок жил где-то в этом временном интервале. Другими словами, задача имеет неопределенное решение, и несет информацию, близкую к нулевой. Это на основании двух 12-маркерных гаплотипов.

То, что Вы удержали информацию по второй панели, оставляет задачу неопределенной. Пять мутаций по третьей панели ничего не дают в этой ситуации без мутаций во второй панели. Дадите их - сообщу Вам оценку по общему предку, но по двум гаплотипам ее ценность тоже близка к нулю.



--------------------
Y-DNA: R1a-Z283
mt-DNA: H

Перейти в начало страницы
 
+Цитировать сообщение
Ostan
сообщение 7.9.2009, 14:32
Сообщение #24


Знаток
****

Группа:  R1a
Сообщений: 685
Регистрация: 22.9.2008
Пользователь №: 804



Анатолий Алексеевич. Вы абсолютно правы. Так сравнивать нельзя. Ох уж эта теория вероятности. Всегда запутаешься, где надо суммировать, а где умножать вероятности. Правильно надо было сравнить распределение вероятности по панелям следующим образом. Найти распределение вероятности для этого случая (когда в одних панелях 0 мутаций, а в других 5). Поскольку распределения по панелям независимые случайные числа, то плотность данного распределения будет равна произведению плотностей вероятности для каждой панели по-отдельности.

Поскольку это надо уже моделировать, я просто грубо оценил эту вероятность. Распределение, в самом деле ,будет иметь максимум в районе 700-800 лет, но матожидание уже сместится ближе к 900. Ну а доверительный интервал, как и положено, составит практически от 0 до 3000. Сама вероятность этого события будет равна интегралу от этого распределения и составит, грубо, 0,1-0,2. Последнее означает, что конфигурационная часть информации(энтропии) хоть и присутствует, поскольку распределения для других случаев 1-4, 2-3, мутаций по панелям будет другим, но является не столь значительным.

Ну а дальнейшее дело большой науки. В которую я уже лезть не хочу. Просто захотелось попытаться объединить в единую модель часть разрозненной информации на сайте, формализовать ее и частично обкатать под различными углами зрения. Это желание базировалось на другом-вспомнить азы теории вероятности. А Вам, Анатолий Алексеевич, отдельное спасибо, что не дали стать "родоначальником" очередной лженауки и поправляли меня в нужный момент.
Перейти в начало страницы
 
+Цитировать сообщение
aklyosov
сообщение 7.9.2009, 16:11
Сообщение #25


Легенда
************

Группа: R1a, Академики
Сообщений: 8858
Регистрация: 4.7.2008
Пользователь №: 526



Все в порядке, уважаемый Ostan. Вы честно старались, и, к Вашей чести, отреагировали на критику правильно.

На самом деле Вы себе, наверное, не представляете, насколько широко распространено желание найти общих предков одним махом по 12-маркерным гаплотипам, да хоть по 67-маркерным. Естественно, если 67-маркерные почти совпадет, да и фамилия одинакова, тогда другой разговор. Но в общем случае эти попытки бессмысленны. Но поскольку они популярны, то рынок тут же отреагировал - появились некие таблицы и формулы, по которым "с 70%-ной вероятностью" общий предок жил тогда-то и тогда-то. И это - на типа заслуженных сайтах.

Это - опиум для народа. Никакой научной базы там нет. Чистые "бабки".



--------------------
Y-DNA: R1a-Z283
mt-DNA: H

Перейти в начало страницы
 
+Цитировать сообщение
Ostan
сообщение 7.4.2010, 8:33
Сообщение #26


Знаток
****

Группа:  R1a
Сообщений: 685
Регистрация: 22.9.2008
Пользователь №: 804



По мере увеличения статистик 12-маркерных гаплотипов, становится возможным использовать более сложные критерии. Одним из них является коэффициент, равный отношению статистики с одной мутацией ( 12-1 ) к статистике самого выбранного гаплотипа ( 12 ), который условно можно назвать коэффициентом древности гаплотипа. Здесь я придерживаюсь терминологии, уже ранее использованной в данной теме.

Интуитивно ясно, что если в определенном регионе в статистике 12-маркерного гаплотипа имеется значительный процент, но он не подтвержден соответствующей статистикой 12-1, то эти гаплотипы являются свежими для данного региона или, образно говоря, залетными. С другой стороны, если носители данного гаплотипа, достаточно давно проживают в данном регионе, то гаплотип неизменно обрастает большим числом родственных гаплотипов, что непосредственно отражается в статистике 12-1. Сам процесс обрастания родственными гаплотипами промоделирован ранее в данной теме Clavis-ом, и я не буду подробно на нем останавливаться. Меня в данном случае пока интересует возможность использования данного коэффициента для определения относительного возраста региональных ветвей и для определения направления возможных миграций носителей данных гаплотипов.

Сама статистика 12-маркерного гаплотипа представляет собой сечение 12-мерной плоскостью дерева n-маркерных гаплотипов и показывает частоту распространения гаплотипов по регионам. Статистика 12-1 в этом представлении захватывает уже некоторый объем, прилегающий к данной плоскости на величину +- 1. Вследствие этого, статистика 12-1 заведомо больше статистики 12 и включает в себя статистику не одного, а 24 гаплотипов. Но для того, чтобы заполнить все эти возможные ячейки соответствующими мутациями, предполагается достаточно длительное проживание носителей данного гаплотипа ( или родственного ) на данной территории.

Одним из преимуществ предлагаемого коэффициента является его независимость от процентного содержания представителей рассматриваемой гаплогруппы в регионе. Однако, вследствие его интегральности, он обладает существенным недостатком. При наличие нескольких миграций на данной территории, разделенных по времени, коэффициент отражает только последнюю, поскольку последняя миграция имеет больший вес.

Для примера обратимся к уже известным статистикам 12-маркерного гаплотипа, являющимся базовым для Северо-евразийской ветви (ветвь "С") гаплогруппы R1a. По последним данным FTDNA для Белоруссии коэффициент древности гаплотипа минимальный и равен 0,8. Небольшие коэффициенты древности и для соседних регионов Литва, Финляндия- 2, Россия- 3, Польша - 4,1 , Украина- 4,0. Для этого региона если и существовуют древние гаплотипы, то они надежно прикрыты более молодой миграцией представителей СЕ ветви, вследствие интегральности рассматриваемого коэффициента.

Совсем другая картина для соседнего более западного региона. Здесь: Германия- 14,5 ; Англия- 5,3 ; Шотландия- 8,5. В этот регион, за исключением может Англии, не было позднейшей миграции представителей СЕ ветви, поэтому в этом регионе регистрируется старая ветвь, являющейся дальнеродственной к СЕ. Впрочем, о возможной родственности Старой норвежской ветви и СЕ уже говорилось на этом сайте достаточно много. Следует только отметить, что больший коэффициент, чем для Германии, регистрируется только для Индии к=15.

Намного больший интерес вызывает Балканский регион, который хотя пока и проработан достаточно плохо статистически, тем не менее дает достаточно плотные результаты. Италия- 7, Греция - >8 ( 8/?=.>8), Словения- >4 ( 4/?= >4). Здесь знаком вопроса показано отсутствие данных в статистике 12, но появление первого же гаплотипа переводит знак > в знак =. Этот регион и ранее вызывал повышенный интерес вследствие всплеска статистики 12-1 ( для Словении, например, 2,5%, а для Греции 1,2% от всех исследованных гаплотипов). Но ранее это трактовалось как результат миграции славянских племен в этот регион в 6-м веке нашей эры. Большие коэффициенты древности для этого региона, чем для СЕ региона однозначно показывают, что отмеченное родство, связано не со славянской миграцией в регион, а с более древней миграцией из Балканского региона в район Прибалтики.

Таким образом, предполагаемая словенская ( балканская ) ветка должна занимать промежуточное положение между Старой норвежской и СЕ. Можно предположить, что единое древнее европейское население R1a под давлением вновь прибывших племен R1b раскололось на два массива. Одна часть сместилась на север Европы, образуя в будущем Старую норвежскую ветвь, а другая часть сместилась на восток, заняв Причерноморские степи ( катакомбная археологическая культура). Возврат второй ветви в район Балкан был осуществлен после 16-го века до н.э. По историческим данным уже к 12-му веку до н.э. в этом регионе отмечены многочисленные венеды ( адриатические, фракийские, малоазиатские). Однако окончательные выводы можно будет сделать только после появления достаточно длинных гаплотипов из данного региона.
Перейти в начало страницы
 
+Цитировать сообщение
aklyosov
сообщение 7.4.2010, 15:35
Сообщение #27


Легенда
************

Группа: R1a, Академики
Сообщений: 8858
Регистрация: 4.7.2008
Пользователь №: 526



Цитата(Ostan @ 7.4.2010, 0:33) *
По мере увеличения статистик 12-маркерных гаплотипов, становится возможным использовать более сложные критерии. Одним из них является коэффициент, равный отношению статистики с одной мутацией ( 12-1 ) к статистике самого выбранного гаплотипа ( 12 ), который условно можно назвать коэффициентом древности гаплотипа.


Уважаемый Ostan,

При беглом чтении я не схватил, что это такое (см. выше). Что такое "отношение статистики"?

Это напоминает хрестоматийное "мы не знаем что такое горжетка, но советуем меньше ездить на велосипеде".

Поэтому я не знаю, что такое "отношение статистики", но полагаю, что Ваши рассуждения могут относиться только к идеальному дереву с одним общим предком. Тогда, действительно, большая доля гаплотипов с одной мутацией - недавний общий предок, малая доля (все остальные мутированы сильнее) - предок древний. Но почему бы тогда не взять гаплотипы просто без мутаций? Много их - предок недавний, мало - предок древний. В чем разница?

Но подобные подходы уже многократно рассматривались, в принципе. Они не дадут сведений о числе ветвей на дереве гаплотипов. И поэтому обычно дают фантомных общих предков.

Далее, в Ваших примерах Вы набросали какие-то коэффициенты, но не сравнили их с обычными подходами. Поэтому смысл и достоверность их теряются. Что, если это и есть фантомные коэффициенты? Как Вы это узнаете? Где проверочные подходы?



--------------------
Y-DNA: R1a-Z283
mt-DNA: H

Перейти в начало страницы
 
+Цитировать сообщение
Ostan
сообщение 8.4.2010, 22:51
Сообщение #28


Знаток
****

Группа:  R1a
Сообщений: 685
Регистрация: 22.9.2008
Пользователь №: 804



Цитата(aklyosov @ 7.4.2010, 19:35) *
Уважаемый Ostan,

При беглом чтении я не схватил, что это такое (см. выше). Что такое "отношение статистики"?

Это напоминает хрестоматийное "мы не знаем что такое горжетка, но советуем меньше ездить на велосипеде".

Поэтому я не знаю, что такое "отношение статистики", но полагаю, что Ваши рассуждения могут относиться только к идеальному дереву с одним общим предком. Тогда, действительно, большая доля гаплотипов с одной мутацией - недавний общий предок, малая доля (все остальные мутированы сильнее) - предок древний. Но почему бы тогда не взять гаплотипы просто без мутаций? Много их - предок недавний, мало - предок древний. В чем разница?

Но подобные подходы уже многократно рассматривались, в принципе. Они не дадут сведений о числе ветвей на дереве гаплотипов. И поэтому обычно дают фантомных общих предков.

Далее, в Ваших примерах Вы набросали какие-то коэффициенты, но не сравнили их с обычными подходами. Поэтому смысл и достоверность их теряются. Что, если это и есть фантомные коэффициенты? Как Вы это узнаете? Где проверочные подходы?

Уважаемый Анатолий Алексеевич, прошу извинить меня за задержку с ответом, но только сейчас добрался до компьютера.

На мой взгляд все статистические модели, даже самые совершенные, носят вероятностный характер. Например, рождаемость мальчиков и девочек примерно одинакова. Но в моем роду около 100 лет не рождались девочки, а в течение четырех поколений родилось 13 представителей мужского пола. С точки зрения теории вероятности такое событие маловероятно ( вероятность менее 1% ), но тем не менее оно произошло.

Так же и с деревьями гаплотипов. Все они носят вероятностный характер, пока не подтверждены соответствующими снипами. Положение осложняется тем, что на 12-маркерных гаплотипах практически невозможно построить сколько-нибудь правдоподобное дерево. Но тем не менее статистики для 12-маркерных гаплотипов существуют. И вопрос только в том: сможем ли мы извлечь из них сколько-нибудь ценную информацию или нет? Вопрос стоит наиболее остро для тех регионов из которых пока не поступают достаточно длинные гаплотипы.

Мои наблюдения показывают, что с помощью статистик 12-маркерных гаплотипов можно получать только самые простые ответы. По сути отвечающие только на вопросы- да или нет.

Еще ранее я заметил, что по отношению к моему гаплотипу, являющимся базовым для СЕ ветви, в статистике FTDNA c одной мутацией ( статистика 12-1)
существуют три максимума. Это Словения-2,5%, Греция- 1,2% и Латвия- 1,2% от всех тестированных гаплотипов. С учетом процентного содержания гаплогруппы R1a в этих странах это дает для Балканского региона от 6 до 10% от всех R1a в этом регионе. Такое большое число родственных гаплотипов не может быть случайным и требует своего объяснения. Первоначально я предположил, что это связано со славянской миграцией со стороны Польши и Прибалтики. Но последующие размышления навели меня на другое решение, что данное родство может быть связано с более ранней миграцией в обратном направлении. Вот я и попытался ответить на этот вопрос.

К сожалению FTDNA не раскрывает в открытых базах большинство гаплотипов, учитываемых в их статистиках. Тем не менее статистики FTDNA в настоящий момент являются наиболее представительными и не использовать их данные просто не осмотрительно.

Появление моего гаплотипа в различных регионах может быть связано как с миграцией, так и с местным его возникновением. Вероятность местного происхождения тем выше, чем большее число родственных гаплотипов присутствует в этом регионе. Так, например для Германии и Индии можно с уверенностью отметить их местное происхождение, поскольку статистика 12-1 в 15 раз превышает статистику самого гаплотипа. Т.е. существует 15 вариантов его происхождения. Если учесть, что статистика 12-1 заведомо больше статистики 12 , теоретически в 24 раза, то данное состояние соответствует равновесному состоянию, поскольку вследствие разных причин, не все теоретические возможности реализуются в мутациях.

Большое количество вариантов происхождения гаплотипа вовсе не свидетельствует о близком родстве. Наоборот, родственные гаплотипы достаточно длительное время проживали на данной территории. Настолько длительно, что процессы их возникновения уравнялись по скоростям с процессами их исчезновения.

Другое дело, когда демографический взрыв , происшедший в каком-либо регионе резко увеличил процентное содержание исследуемого гаплотипа. Для нашего гаплотипа такой взрыв произошел где-то рядом с территорией Белоруссии или непосредственно в самой Белоруссии. Для этого региона, как я уже показывал отношение значения статистики 12-1 к соответствующему значению статистики 12 составляет 0,8 и является минимальным для всех протестированных регионов.

Но чтобы гаплотип стал доминирующим в регионе он уже должен быть в этом регионе изначально и в достаточном процентном отношении. Т.е. встает вопрос; в результате какой миграции этот гаплотип появился в этом регионе? Естественно на этот вопрос ответить, что наиболее вероятное его происхождение из региона, где исследуемый гаплотип или близкородственный уже присутствовал в достаточном количестве. Данное заключение носит только вероятностный характер. Именно к такому заключению я и пришел. Что наиболее вероятно происхождение моего гаплотипа и ветки СЕ из Балканского региона.
Перейти в начало страницы
 
+Цитировать сообщение

2 страниц V  < 1 2
Ответить в данную темуНачать новую тему
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 

              Mantlet IPB skin Designed by Fisana, IPBskins.ru
RSS Текстовая версия Сейчас: 26.8.2019, 8:03
 
     




Генеалогический сайт Рунета Сайт Всероссийского Генеалогического Древа Генеалогическая сеть Анализ фамилий Cайт рода R1a Краеведческий сайт Чеченский ДНК проект


© 2004-2015 RODSTVO.RU