Support of multi-genotype VCFs
Created by: karatheodory
Загрузка Multil-genotype VCF-файлов
VCF-файлы (сэмплы) могут содержать в себе несколько генотипов. Генотипы с точки зрения системы должны восприниматься как отдельные сэмплы. Для их поддержки требуются следующие изменения:
- На фронтенде вместо версии сэмпла должна использоваться версия конкретного генотипа сэмпла.
- При отправке запросов на анализ в дополнение к идентификатору сэмпла нужно отправлять имя генотипа.
- Для сэмплов, в которых содержится только один генотип, в качестве значения имени по-умолчанию должно использоваться значение
NULL
Для их поддержки нужно внести в систему следующие изменения:
-
создать таблицу sample_genotype (id, sample_id, genotype_name) -
создать таблицу genotype_version (id, sample_id) -
создать генотипы для всех существующих сэмплов со значением имени генотипа по умолчанию -
скопировать версии сэмплов в качестве версий генотипов из vcf_file_sample_versionвgenotype_version -
добавить vcf_file_sample_value.genotype_id, скопировать в него значения из поляvcf_file_sample_value.vcf_file_sample_version_id -
удалить ограничение и само поле vcf_file_sample_value.vcf_file_sample_version_id -
удалить таблицу vcf_file_sample_version -
переделать вставку данных от AS, чтобы правильно добавлять генотипы и их поля -
переделать запросы в БД, чтобы они вместо версии сэмпла возвращали версию генотипа -
Xпереименоватьvcf_file_sample_value->genotype_field -
Xпереименоватьvcf_file_sample*->sample*во всех местах -
Xпереименоватьlangu*->language*во всех местах