Support of multi-genotype VCFs
Created by: karatheodory
Загрузка Multil-genotype VCF-файлов
VCF-файлы (сэмплы) могут содержать в себе несколько генотипов. Генотипы с точки зрения системы должны восприниматься как отдельные сэмплы. Для их поддержки требуются следующие изменения:
- На фронтенде вместо версии сэмпла должна использоваться версия конкретного генотипа сэмпла.
- При отправке запросов на анализ в дополнение к идентификатору сэмпла нужно отправлять имя генотипа.
- Для сэмплов, в которых содержится только один генотип, в качестве значения имени по-умолчанию должно использоваться значение
NULL
Для их поддержки нужно внести в систему следующие изменения:
-
создать таблицу sample_genotype (id, sample_id, genotype_name)
-
создать таблицу genotype_version (id, sample_id)
-
создать генотипы для всех существующих сэмплов со значением имени генотипа по умолчанию -
скопировать версии сэмплов в качестве версий генотипов из vcf_file_sample_version
вgenotype_version
-
добавить vcf_file_sample_value.genotype_id
, скопировать в него значения из поляvcf_file_sample_value.vcf_file_sample_version_id
-
удалить ограничение и само поле vcf_file_sample_value.vcf_file_sample_version_id
-
удалить таблицу vcf_file_sample_version
-
переделать вставку данных от AS, чтобы правильно добавлять генотипы и их поля -
переделать запросы в БД, чтобы они вместо версии сэмпла возвращали версию генотипа -
X
переименоватьvcf_file_sample_value
->genotype_field
-
X
переименоватьvcf_file_sample*
->sample*
во всех местах -
X
переименоватьlangu*
->language*
во всех местах