Пользователь:ProteinBoxBot


Проект Gene Wiki был инициирован примерно в 2007 году как попытка систематически улучшать состояние статей о генах в Википедии. Основным механизмом для этого проекта было редактирование ботов на основе данных, основанное на широко используемых базах данных в биомедицинских исследованиях (например, NCBI Entrez, UniProt, PDB). Дополнительную информацию об этой инициативе можно найти на Portal:Gene Wiki . Некоторый исторический контекст представлен в разделах ProteinBoxBot и ProteinBoxBot2 ниже.

В настоящее время мы расширяем этот план игры на другие биомедицинские концепции. Более подробная информация находится в разделе ProteinBoxBot 3 ниже.

На этом этапе ProteinBoxBot мы расширим область применения за пределы человеческих генов и белков. Этот план в настоящее время находится в зачаточном состоянии и активно обсуждается. Область применения обсуждалась с Wikipedia:WikiProject Pharmacology ( [1] ) и Wikipedia:WikiProject Medicine ( [2] ). Чтобы централизовать обсуждение между всеми заинтересованными сторонами, посетите страницу проекта User:ProteinBoxBot/Phase 3 .

Новая версия бота была создана для поддержки Protein Boxes на страницах Gene Wiki. Он запрашивает информацию из службы аннотаций генов MyGene.info (которая сама собирает информацию из общедоступных баз данных) и сравнивает ее со значениями в существующих информационных полях статей. Если информация о статье устарела, неверна или отсутствует, информационное поле обновляется правильными значениями. Затем он сканирует Commons в поисках изображений структуры белка, соответствующих теме белковой коробки. Если он находит его, изображение добавляется; если нет и имеется достаточно информации, бот создает, загружает и связывает новое изображение. Этот бот не создает страницы и не редактирует полнотекстовые статьи (пока). Исходный код бота доступен по адресурепозиторий кода GeneWiki . Эта версия разрабатывается и поддерживается Pleiotrope совместно с AndrewGNF .

Этот бот создал или изменил около 9000 страниц, соответствующих генам млекопитающих. Каждая новая страница заполнялась контентом из общедоступных баз данных. Это содержание включало информацию о символе гена, описании, функции, геномном расположении, структуре и идентификаторах. Были созданы гены, у которых не было существующих страниц в Википедии для их символа, псевдонимов или названия (например, MMP9 ). Гены, которые имели эти конфликты в пространстве имен wikipedia, были помечены для ручной интеграции (например, Apolipoprotein_E ). Этот бот в настоящее время разрабатывается и разрабатывается AndrewGNF и JonSDSUGrad при существенном участии сообщества WP:MCB .