Детективный лейтмотив: анализ ДНК с места преступления позволяет мгновенно вычислить преступника. Насколько же это далеко от реальности?
В конце августа в научном издании Proceedings of National Academy of Sciences вышла статья с названием “Идентификация личности путем предсказания индивидуальных черт на основе данных полной расшифровки генома”. В работе утверждается, что то, о чем мечтают судмедэксперты (и не только они), достигнуто: исследователи научились по образцу ДНК строить фоторобот человека и даже описывать его голос. Вот только не выдают ли они желаемое за действительное?
Для эксперимента ученые собрали подробные биометрические данные 1061 жителя Сан-Диего и секвенировали их геномы. “Мы смогли идентифицировать [по ДНК] в среднем 8 человек в группе из 10 случайно выбранных испытуемых, если этнический состав группы был смешанным, и 5 из 10 – если группа состояла исключительно из афроамериканцев или людей европейской внешности”, – заявляют авторы работы.
Метод позволяет не только определить, обладателю какого набора биометрических данных принадлежит образец ДНК, но и построить портрет участника эксперимента. Для этого усредненное для данного этноса, возраста и пола лицо видоизменяется согласно определенным параметрам – опорные точки на кончике носа, в уголках глаз и других местах сдвигаются по вычислениям алгоритма на основе ДНК. В статье есть иллюстрации, и выходит, во всяком случае на первый взгляд, достаточно похоже. Значит, работа – успех? По оставленной на месте преступления капле крови можно создать точный фоторобот преступника (что хорошо), а по образцу ДНК, хранящемуся в геномном банке, вашу личность можно вычислить, например, по фотографиям в социальных сетях (что нарушает приватность)? Но, похоже, торопиться с выводами не стоит.
Основной автор исследования – скандально знаменитый американский генетик Крэйг Вентер. В конце 1990-х Вентер создал коммерческую компанию, которая в конкуренции с глобальным научным проектом “Геном человека” пыталась расшифровать ДНК – планировали даже запатентовать описание генома. Но в конце концов Вентеру пришлось объединить усилия с другими учеными. С тех пор имя генетика связано в основном с идеями конструирования синтетической жизни – речь пока идет о простейшей бактерии. Но это не единственный интерес Вентера.
Если присмотреться к составу авторов статьи, вышедшей в PNAS, можно заметить, что все они работают в одной компании – Human Longevity, которую Вентер основал в 2013 году. Задача стартапа –собрать крупнейшую в мире библиотеку человеческих геномов, не менее миллиона экземпляров. Цель благородная: наука еще лишь в редких случаях понимает взаимосвязь между конкретными генами или их комплексами и болезнями. Иногда мутация лишь в одном гене с большой вероятностью приводит к развитию наследственного заболевания, и тогда, исправляя ошибки в ДНК половых клеток родителей, например, с помощью метода CRISPR-Cas9 можно гарантировать рождение здорового ребенка (эта технология уже испытана и наверняка работает, ее клиническому применению пока препятствуют этические соображения). Но в подавляющем большинстве случаев мы не знаем, какие участки генетического кода связаны с болезнью. Для того чтобы установить такие связи, исследователям просто не хватает данных – человеческих геномов и информации об их носителях.
Под эти цели Вентеру удалось привлечь инвестиции на 300 миллионов долларов. Считается, что Human Longevity обладает лучшими инструментами для секвенирования ДНК. И хотя до достижения заявленных целей достаточно далеко, фирма уже с 2015 года предлагает услуги “суперанализа”: за 25 тысяч долларов любой желающий может пройти “медосмотр на стероидах”, по выражению Вентера. Это не только подробнейший медицинский осмотр, но и полная расшифровка собственного генома и генома микробиоты – микрофлоры кишечника.
Но какой смысл платить огромные деньги за расшифровку генома, по которой мало что можно сказать о здоровье? Human Longevity нужно демонстрировать клиентам и инвесторам успехи на ниве интерпретации ДНК, и опубликованная работа – очевидный шаг в этом направлении. Впрочем, не все согласны, что этот шаг Вентеру действительно удался.
6 сентября генетик, научный директор генеалогического проекта MyHeritage.com Янив Эрлих опубликовал заметку с резкой критикой работы Крэйга Вентера и его коллег:
Метод использует технически ошибочные метрики и не позволяет никого идентифицироватьЯнив Эрлих
“В этой статье я привожу существенные ошибки, допущенные в работе [Вентера и других]. Вкратце: метод, предложенный авторами, который в действительности мало отличается от примитивной стандартной процедуры, не использует в достаточной мере возможности генетических маркеров, использует технически ошибочные метрики и, наконец, не позволяет никого на самом деле идентифицировать”.
Эрлих и некоторые другие ученые обратили внимание, что для восстановления внешности носителя ДНК Вентер и его коллеги фактически используют только те участки генома, которые указывают на генеалогию и пол. Затем алгоритм смешивает усредненные лица представителей этносов, которые были среди предков испытуемого. Другими словами, никакие индивидуальные особенности, кроме базовой генеалогии, практически не учитываются. Именно поэтому система, созданная Human Longevity, способна с вероятностью 70 процентов правильно идентифицировать человека в этнически смешанной группе из 20 человек, а вот если взять набор из 20 белых мужчин, вероятность ошибки будет уже 89 процентов – это не так уж далеко от 95-процентной ошибки при совершенно случайном выборе.
Специалисты указывают на то, что пул участников эксперимента был слишком мал, чтобы на основании исследования их геномов можно было получить новую информацию о том, какие именно гены в действительности обусловливают конкретные особенности внешности. “Предсказание вида лица на самом деле не более чем построение среднего лица для вашего этноса. Конечно, увидев его, вы всегда скажете – ух ты, чем-то похоже на мое!” – заметил в комментарии изданию MIT Technology Review биоинформатик Джэйсон Пайпер.
Пайпер значится среди соавторов опубликованной в PNAS статьи, но за то время, которое заняла ее публикация, он успел уволиться из Human Longevity (теперь работает в Apple), более того, стал одним из наиболее яростных критиков работы Вентера в твиттере – и даже был забанен бывшим начальником. Помимо Пайпера, компанию покинул еще один соавтор статьи – известный специалист по машинному обучению Франц Ош, до этого перекупленный Вентером из Google. Впрочем, и выход статьи несколько раз откладывался: по данным MIT Technology Review, Крэйг Вентер пытался пристроить работу в один из двух наиболее респектабельных научных журналов мира, Science, но получил отказ – и только тогда выпустил заметку в менее престижном PNAS.
Предсказание внешности на основе ДНК – лишь вопрос времени. Практически все человеческие черты и особенности физиологии в большей или меньшей степени определяются генами (например, цвет глаз – на 98 процентов, индекс массы тела – на величину от 50 до 93 процентов), и рано или поздно с помощью компьютерного анализа больших массивов ДНК и данных об их носителях связь между генами и строением лица, ростом, голосом и другими чертами будет установлена. Возможно, это будет сделано с помощью библиотек, собранных коммерческими компаниями, такими как Human Longevity Крэга Вентера. Но пока этот безусловно талантливый авантюрист, похоже, снова поторопился. Посмотрите на забавный коллаж, сделанный Янивом Эрлихом. Слева – лицо самого Вентера, в центре – сделанное алгоритмом на основе его ДНК предсказание, а справа – актер Брэдли Купер. На кого фоторобот похож больше?