TAR / сомнительный и Unicode
Perl осуждает использование строк с кодовыми точками больше 0xFF в XOR. Это влияет на логику сопоставления WP: JCW / TAR и WP: JCW / CRAP для некоторых цитат. Я изменил логику на символы "де-Юникод" до выполнения сопоставления строк. Это изменение есть в результатах, только что загруженных для обоих. В целом вроде работает в лучшую сторону, но появились дополнительные ложные срабатывания. Например, в TAR3 № 240 теперь использует «Палеонтологический Журнал», что является русским названием , а № 299 теперь принимает «КМЕ», что является ложным срабатыванием (хотя это всего лишь 1 буква отличия от NME, кириллицы). K заставлял оригинальный XOR пропустить его). Также могли быть некоторые непреднамеренные странности. Если кто-нибудь увидит что-нибудь странное, дайте мне знать. Спасибо. - JLaTondre ( разговор ) 22:20, 24 августа 2018 г. (UTC)
- Да вроде работает лучше. Очень хорошо улавливает русские / кириллические имена, которые действительно совпадают с журналами. Ложные срабатывания случаются редко, и их легко исключить. Headbomb { t · c · p · b } 23:45, 24 августа 2018 г. (UTC)
tld | JCW-include
Может ли бот это поддерживать? {{JCW-include|EEC Journal|EEC J.|EEC J}}
Идея заключалась бы в том, чтобы вместо объявления чего-то вроде
- КАГЕНА ≠ КАТЕНА
- CAGENA ≠ Камера 35
- CAGENA ≠ Камера!
- CAGENA ≠ Can Ent
- CAGENA ≠ Можно. Ent.
- CAGENA ≠ La Casana
- CAGENA ≠ Камера
и надеюсь, что в будущем ничего не подкрадется , у нас может быть просто Headbomb { t · c · p · b } 00:33, 25 августа 2018 г. (UTC){{JCW-include|CAGENA|Cagena}}
- Итак, в TAR исключить все, что не соответствует включению? Да, это выполнимо (хотя в будущем не будет опечаток). Вы хотели поддержать обоих? Это потребует немного больше работы. - JLaTondre ( разговор ) 13:34, 28 августа 2018 г. (UTC)
- Было бы поддерживать обоих. Идея состоит в том, что такие вещи , как ABA Journal в WP: JCW / Target10, имеют около 20 исключений для настройки, и как только какая-то другая трехбуквенная организация создаст журнал, он также будет выбран. Тем не менее, он должен по-прежнему получать перенаправления как обычно (изменен шаблон, чтобы прояснить намерение), поэтому, если создается что-то вроде Американской ассоциации адвокатов (1935-) и перенаправляется на журнал ABA , мы это увидим. Это будет просто сказать боту: «Не ищите варианты». Headbomb { t · c · p · b } 14:08, 28 августа 2018 г. (UTC)
- Хотя, если у вас есть время только на то, чтобы поработать либо над группировкой для WP: CRAPWATCH, либо над этим, группировка имеет более высокий приоритет. Headbomb { t · c · p · b } 14:16, 28 августа 2018 г. (UTC)
- На самом деле поставьте это на паузу. Мне нужно надеть мыслящую шляпу. Headbomb { t · c · p · b } 14:18, 28 августа 2018 г. (UTC)
Соответствие цели JCW
Многие журналы названы примерно так
- Foobar: Официальный журнал Общества Бла
- Foobar: Официальный журнал общества бла
- Фубар: официальный орган общества бла
- Foobar: Официальный журнал Общества Бла
Если вы найдете что-то (The|an)?\s*(Official|International)\s*(Blog|Bulletin|Gazette|Guide|Handbook|Journal|Magazine|Newsletter).*
в конце , считайте это эквивалентом той же строки без The Official Whatever .
Идея состоит в том, что Официальный журнал Европейского Союза и Официальный журнал Международной ассоциации билиарных гепато-панкреатозов являются законными, но Обзоры ожирения: Официальный журнал Международной ассоциации по изучению ожирения = Обзоры ожирения . Headbomb { t · c · p · b } 00:32, 19 августа 2018 г. (UTC)
- Чтобы подтвердить, это для начальной обработки (например, WP: JCW / ALPHA ), а не только для обработки TAR? - JLaTondre ( разговор ) 20:23, 19 августа 2018 г. (UTC)
- Это будет для TAR и CRAP. Headbomb { t · c · p · b } 00:07, 20 августа 2018 г. (UTC)
- Реализовано. Обновленный TAR был загружен, так что вы можете его проверить. - JLaTondre ( разговор ) 00:00, 1 сентября 2018 г. (UTC)
- Рад слышать! Я посмотрю и вернусь к вам! Headbomb { t · c · p · b } 00:08, 1 сентября 2018 г. (UTC)
- Кажется, работает. Далее группировка! Headbomb { t · c · p · b } 01:29, 1 сентября 2018 г. (UTC)
Не можете забрать запись?
На WP: JCW / Target8 у нас есть
Однако подобрать не удалось.
по какой-то причине. Headbomb { t · c · p · b } 18:01, 19 сентября 2018 г. (UTC)
- Глядя на B36, показывает:
display=''[[Bulletin of the Atomic Scientist]]''|d-type=j|target=[[ bulletin of the Atomic Scientists ]]|t-type=?
display='''[[Bulletin of the Atomic Scientists]]'''|d-type=j|target=[[Bulletin of the Atomic Scientists]]|t-type=j
- Пробелы на первом - это проблемы, поскольку с точки зрения программного обеспечения это разные цели. Это также причина, по которой он неправильно разрешает тип заголовка. Глядя на Bulletin of the Atomic Scientist, видно, что страница:
#redirect [[ bulletin_of_the_Atomic_Scientists ]]
- Бот неправильно обрабатывает пробелы в перенаправлении. Это простое решение. Я внес изменения и повторюсь, чтобы проверить их. К сожалению, это первый и самый длинный шаг в парсинге дампа ... - JLaTondre ( разговор ) 00:13, 20 сентября 2018 г. (UTC)
- Исправлено, обновлено сохранение результатов. - JLaTondre ( разговор ) 22:19, 20 сентября 2018 г. (UTC)
- Ага. Не многие записи изменились, но это имеет большое значение для выбранных журналов (например, Acta Crystallographica переместилась с № 206 на № 154). Перемещение в WP: JCW / Target9 / WP: JCW / Target10 в основном связано с лучшими исключениями. Спасибо. С нетерпением жду следующего дампа и последних доработок WP: JCW / CRAP . Headbomb { t · c · p · b } 00:58, 21 сентября 2018 г. (UTC)
- Исправлено, обновлено сохранение результатов. - JLaTondre ( разговор ) 22:19, 20 сентября 2018 г. (UTC)
Настроить JL-Bot?
Если подумать вслух, когда дело доходит до определенных вещей, например, полмиллиона перенаправлений в издательскую группу OMICS , вещи не совсем дотягивают до уровня включения в WP: JCW / TAR , но все же полезно иметь централизованная страница, чтобы иметь представление о том, что связано, что опечатано, и все такое.
Я думаю о создании своего рода WP: JCW / CRAP , где бот компилирует вещи, как в WP: JCW / TAR , но для определенных целей (объявленных в User: JL-Bot / Questionable.cfg ). Что здесь возможно? Headbomb { t · c · p · b } 06:49, 3 августа 2018 г. (UTC)
- Да, создание общих целей на основе списка было бы простым расширением. Я не понимаю предназначение материала TARGET2 +? Спасибо. - JLaTondre ( разговор ) 12:27, 4 августа 2018 г. (UTC)
По сути, это ручной способ создания «групп» целей. Например{{JCW-selected|Bentham Science Publishers|Category:Bentham Science Publishers academic journals}}
- Издательство Bentham Science
- Категория: Научные журналы Bentham Science Publishers
будет сокращением для
- Издательство Bentham Science
- Комбинаторная химия и высокопроизводительный скрининг
- Текущее исследование болезни Альцгеймера
- Текущие целевые показатели лекарств от рака
- Текущий метаболизм лекарств
- Современная генная терапия
- Текущая геномика
- Текущие исследования ВИЧ
- Современная лекарственная химия
- Современная молекулярная медицина
- Современная органическая химия
- Текущий фармацевтический дизайн
- Актуальные темы медицинской химии
- Мини-обзоры по медицинской химии
- Открытый журнал клинической химии
- Открытый экологический журнал
- Открытый гематологический журнал
+
- Все, что перенаправляет на любой из них.
- Опечатки и варианты
Для более простого случая {{JCW-selected|Baishideng Publishing Group|World Journal of Gastroenterology}}
Это будет выглядеть примерно так
Классифицировать | Издатель / Журнал | Записи (цитаты, статьи) | Всего цитирований | Отличные статьи |
---|---|---|---|---|
1 | Издательская группа Baishideng |
| 638 | 350 |
Headbomb { t · c · p · b } 15:43, 4 августа 2018 г. (UTC)
- Значит, первым параметром всегда будет страница? А вторые + параметры могут быть страницами или категориями? - JLaTondre ( разговор ) 13:48, 5 августа 2018 (UTC)
- Что ж, я полагаю, что теоретически это может быть категория, но я не могу представить себе случай, когда на практике у вас будет категория без основной статьи. Headbomb { t · c · p · b } 15:50, 5 августа 2018 г. (UTC)
Перерыв
Сначала отрежьте здесь . У него нет иерархии в столбце «Записи». Насколько это важно? Существующая логика TAR нелегко поддается этому. Если нужно, я постараюсь втиснуть его, но это займет больше времени. Кроме того, дайте мне знать, соответствует ли он тому, что вы искали. Если это так, я интегрирую его в обычный бот. - JLaTondre ( разговор ), 23:09, 5 августа 2018 г. (UTC)
@ JLaTondre : Вы имеете в виду алфавитный порядок в "Target"? Не очень важно. Во втором столбце было бы неплохо сортировать маркированную иерархию.
- Ссылка 1
- Ссылка 1 перенаправление
- Ссылка 1 опечатка
- Ссылка 2
- Ссылка 2 перенаправление
- Ссылка 2 опечатка
Опечатки и перенаправления опускаются, если они не используются, но прямые ссылки будут включены, даже если они не используются. Headbomb { t · c · p · b } 00:14, 6 августа 2018 г. (UTC)
Глядя на первый монтаж, несколько вещей. Сначала это [1] .
Но также статьи 10/23/34 (Frontiers in Psychology / Frontiers in Plant Science / Frontiers in Endocrinology) должны были быть сгруппированы с первой записью Frontiers Media , как заявлено в
- Frontiers Media
- Категория: Научные журналы Frontiers Media
См. Макет (записи №1, №2 и №4) . В записи № 2 я объединил только Abstract и Applied Analysis , Advances in High Energy Physics и BioMed Research International , но вы можете представить, что другие журналы Category: Hindawi Publishing делают то же самое. Headbomb { t · c · p · b } 00:24, 6 августа 2018 г. (UTC)
- Он также должен улавливать красные ссылки + опечатки этих красных ссылок. Например,
{{JCW-selected|Asian Journal of Chemistry}}
следует сообщить об азиатском журнале химии (7) (на WP: JCW / A66 ) и о совпадениях для таких вещей, как Asan Journal of Chemistry, если они существуют. Headbomb { t · c · p · b } 01:11, 6 августа 2018 г. (UTC)- Под иерархией я имел в виду группировку. Существующий код TAR не настроен для обработки этого, поэтому мне потребуется немного времени, чтобы вставить его туда. Я проверю отсутствующие страницы. - JLaTondre ( разговор ) 20:26, 6 августа 2018 г. (UTC)
- Для Азиатского химического журнала у него нет цели (цель - на A66). Поэтому при поиске общих целей ничего не возвращает. Я думаю, что вместо сопоставления по целям (как это делает TAR) это действительно должно совпадать с отображаемыми значениями. Если отображаемое значение имеет цель, тогда оно будет искать другие страницы с той же целью. Имеет ли это смысл? Или я что-то упускаю? - JLaTondre ( разговорное ) 20:53, 7 августа 2018 г. (UTC)
- Что ж, для заявленных целей, которые являются красными ссылками, целью является сама красная ссылка. Так
{{JCW-selected|Asian Journal of Chemistry}}
значит совпадение + варианты. Однако структура имеет смысл с точки зрения кода. Headbomb { t · c · p · b } 21:02, 7 августа 2018 г. (UTC)|journal=Asian Journal of Chemistry
- Что ж, для заявленных целей, которые являются красными ссылками, целью является сама красная ссылка. Так
Классифицировать | Издатель / Журнал | Записи (цитаты, статьи) |
---|---|---|
1 | Азиатский химический журнал |
|
Кроме того, можно кормить Asian Journal of Chemistry
в [3] , чтобы получить дополнительные варианты ( Азиатский J. Chem. / Азиатский J Chem и опечатки из указанных вариантов ( азиатская J-Chem ). Headbomb { т · с · р · б } 21:08, 7 августа 2018 (UTC)
- @ Tokenzero : сможет ли ваш сайт справиться с этой дополнительной нагрузкой, не давя на себя? Headbomb { t · c · p · b } 21:09, 7 августа 2018 г. (UTC)
Выбранный формат
Я хотел бы ограничить формат User: JL-Bot / Questionable.cfg, чтобы не разрешать "|" в примечаниях или исходных полях (т. е. используется только для разделения параметров шаблона {{ JCW-selected }}). Смотрите это изменение . Это значительно упрощает синтаксический анализ этого шаблона и снижает вероятность ошибки. - JLaTondre ( разговор ) 19:30, 12 августа 2018 г. (UTC)
- @ JLaTondre : конечно, внеси необходимые изменения, я на семейном мероприятии следующие несколько часов. В конечном итоге это будет жестко ограничивать то, что мы можем добавить в заметку / исходный код (например, другие шаблоны), но это не должно быть слишком большим делом. По крайней мере на данный момент. Headbomb { t · c · p · b } 19:38, 12 августа 2018 г. (UTC)
- После размышлений есть простой способ справиться с этим. Пока поля примечания и источники всегда находятся в конце (т.е. бот будет игнорировать что-либо после того, что наступит раньше), у нас все будет хорошо. Преимущества сна на нем. ;-) Спасибо. - JLaTondre ( разговор ) 22:51, 14 августа 2018 г. (UTC)
- Конечно, это работает! У вас есть расчетное время прибытия для прототипа? Headbomb { t · c · p · b } 23:33, 14 августа 2018 г. (UTC)
Вторая версия
Я залил следующую версию. Сейчас он должен ловить такие случаи, как "Asian Journal of Chemistry". Мне все еще нужно поработать над группировкой и заставить бота сохранить ее в вики с разбивкой по страницам. Я также ничего не делал с сокращениями LTWA. Я буду продолжать работать над этим, но прогресс будет немного медленным, как и некоторые другие вещи, которые меня тоже занимают. - JLaTondre ( разговор ) 00:26, 17 августа 2018 г. (UTC)
- Это нормально, мы можем многое сделать с плохой группировкой и поиском без LTWA, даже если это не на 100% идеально. Надеюсь, что обе эти вещи будут реализованы! (Я бы сказал, что из этих двух группировка была бы наиболее выгодной). Headbomb { t · c · p · b } 01:13, 17 августа 2018 г. (UTC)
- @ JLaTondre : кстати, даже если вы не внесли никаких улучшений в код, новая загрузка WP: CRAPWATCH все равно будет очень полезна. Headbomb { t · c · p · b } 14:28, 23 августа 2018 г. (UTC)
- Загрузил новую версию. - JLaTondre ( разговор ) 21:59, 24 августа 2018 г. (UTC)
- @ JLaTondre : кстати, даже если вы не внесли никаких улучшений в код, новая загрузка WP: CRAPWATCH все равно будет очень полезна. Headbomb { t · c · p · b } 14:28, 23 августа 2018 г. (UTC)
Группировка
@ Headbomb : Попал в следующую ситуацию: {{JCW-selected|Allied Academies|Category:Allied Academies academic journals|source=BPL}}
Большинство страниц в категории перенаправляются в Союзные Академии, так что это уже их цель. Итак, как вы хотите, чтобы это было представлено в таблице? Только что в списке союзных академий? Внесен в список союзных академий, а также как его собственная? Другими словами, это:
Классифицировать | Издатель / Журнал | Записи (цитаты, статьи) | Всего цитирований | Отличные статьи |
---|---|---|---|---|
1 | Союзные академии |
| 15 | 4 |
Или это:
Классифицировать | Издатель / Журнал | Записи (цитаты, статьи) | Всего цитирований | Отличные статьи |
---|---|---|---|---|
1 | Союзные академии |
| 15 | 4 |
Я бы предположил, что первого было бы достаточно, но второй - если бы я воспринимал исходное описание буквально. - JLaTondre ( разговор ) 15:23, 1 сентября 2018 г. (UTC)
@ JLaTondre : Первое, да. Иерархия для столбца "записи" будет
Классифицировать | Издатель / Журнал | Записи (цитаты, статьи) | Всего цитирований | Отличные статьи |
---|---|---|---|---|
1 | Союзные академии |
| 15 | 4 |
Headbomb { t · c · p · b } 15:36, 1 сентября 2018 г. (UTC)
Группировка, дубль 1
Выложена первая версия группировки на основе дампа 20180901. Это не идеально - цель всегда указывается на стороне записей, даже если у нее нет ссылок. Мне нужно будет изучить это, а также интегрировать его в основной запуск бота, чтобы бот загружал результаты с разбивкой на страницы. - JLaTondre ( разговор ) 22:47, 3 сентября 2018 г. (UTC)
Выглядит неплохо. Потребуется несколько доработок, но он на правильном пути. В общем что-то вроде тока
- Международный журнал экологических исследований и общественного здравоохранения
- Int J Environ Res Public Health (26 из 24)
- Int. J. Environ. Res. Publ. Здоровье (1 в 1: 1)
- Int. J. Environ. Res. Общественное здравоохранение (7 из 7)
- Международный журнал исследований окружающей среды и общественного здравоохранения (170 из 155)
должен быть вместо этого (например, если у вас есть хиты на «первом уровне», укажите числа на «первом уровне»)
- Международный журнал исследований окружающей среды и общественного здравоохранения (170 из 155)
- Int J Environ Res Public Health (26 из 24)
- Int. J. Environ. Res. Publ. Здоровье (1 в 1: 1)
- Int. J. Environ. Res. Общественное здравоохранение (7 из 7)
а также
- Алгоритмы (журнал)
- Алгоритмы (5 из 5: 1, 2, 3, 4, 5)
может просто быть
- Алгоритмы (5 из 5: 1, 2, 3, 4, 5)
Однако это (нет попаданий на первом уровне, но на втором уровне)
- Хорватская Википедия
- Википедия (2 в 2: 1, 2)
правильно, поскольку мы видим базовую структуру перенаправления. Тогда как
- MDPI
было бы бесполезно, поскольку ни к нему, ни к его перенаправлениям нет никакого обращения. Headbomb { t · c · p · b } 00:11, 4 сентября 2018 г. (UTC)
- Внесены изменения. - JLaTondre ( разговор ) 15:24, 15 сентября 2018 г. (UTC)
- Кажется, отсутствует только эта часть
- Алгоритмы (журнал)
- Алгоритмы (5 из 5: 1, 2, 3, 4, 5)
- Алгоритмы (журнал)
- что может быть просто
- Алгоритмы (5 из 5: 1, 2, 3, 4, 5)
- Headbomb { t · c · p · b } 22:15, 15 сентября 2018 г. (UTC)
- Фиксированный. - JLaTondre ( разговор ) 18:14, 6 октября 2018 г. (UTC)
- Кажется, отсутствует только эта часть
- Внесены изменения. - JLaTondre ( разговор ) 15:24, 15 сентября 2018 г. (UTC)
Перемещено в / Под вопросом
Я переместил все, что было в / Selected #, в / Questionable #, кстати (включая /Selected.cfg в /Questionable.cfg). Это более ясное имя, но {{ JCW-selected }} остается прежним. У меня есть несколько дополнительных планов по этому шаблону и компиляции, но это можно сделать один раз / Questionable отполирован, и последние несколько изломов проработаны, и многостраничный материал реализован. Headbomb { t · c · p · b } 01:04, 17 сентября 2018 г. (UTC)
- Можем ли мы получить новый запуск WP: CRAPWATCH (в новом месте), даже если в коде нет других улучшений? Headbomb { t · c · p · b } 15:58, 24 сентября 2018 г. (UTC)
- Результаты дампа 20181001 загружены. В эти выходные, если все пойдет хорошо, я надеюсь завершить оставшиеся предметы, а также задействовать их в обычном запуске. - JLaTondre ( разговор ) 21:03, 3 октября 2018 г. (UTC)
- Исправлен случай "(журнал)" выше и реализовано сохранение как часть запуска бота. Он выполняет 1500 строк на страницу (фактический вывод будет длиннее, поскольку он продолжает добавлять строки до тех пор, пока последняя добавленная строка не превысит 1500, например: всего 1450, следующей строки 75, окончательное количество будет 1525). Поскольку количество строк в строке может значительно различаться для сомнительных целей, чем для общих целей, использование линий казалось лучше, чем количество строк. Далее рассмотрим использование переадресации при ложных срабатываниях. - JLaTondre ( разговор ) 18:21, 6 октября 2018 г. (UTC)
- Результаты дампа 20181001 загружены. В эти выходные, если все пойдет хорошо, я надеюсь завершить оставшиеся предметы, а также задействовать их в обычном запуске. - JLaTondre ( разговор ) 21:03, 3 октября 2018 г. (UTC)
- Удивительный. Я сделаю подробный обзор по мелочам, но быстрые результаты выглядят неплохо. Headbomb { t · c · p · b } 18:28, 6 октября 2018 г. (UTC)
WP: CRAPWATCH вопрос
В № 6 (издательская группа OMICS) у вас есть те же ложные срабатывания, что и в нескольких журналах. Чтобы настроить исключения, нужно ли нам использовать
- Издательская группа ОМИКС ≠ RCA Review
чтобы охватить все случаи или отдельные исключения, такие как
- Res Rev: J Agric Allied Sci ≠ Обзор RCA
- Res Rev: J Bot Sci ≠ Обзор RCA
- Res Rev: J Chem ≠ Обзор RCA
- ...
Первое было бы гораздо полезнее. Headbomb { t · c · p · b } 14:34, 7 сентября 2018 г. (UTC)
- Так что игнорировать все перенаправления как на цель, так и на цель? Да, это выполнимо. Просто для сомнительных? Или также для TAR? - JLaTondre ( разговор ) 22:56, 7 сентября 2018 г. (UTC)
- Ну / TAR нормально работает как есть. / Сомнительный - это тот, у которого есть повторы, поэтому это будет для / Сомнительный. Headbomb { t · c · p · b } 03:24, 8 сентября 2018 г. (UTC)
- Что касается группировок, я предполагаю, что если заголовок группы (пример: «Биомедицинские исследования» в примере таблицы «Союзные академии» далее на странице) исключен, все, что находится в этой группе, также должно быть исключено (даже если не соответствует исключение)? - JLaTondre ( разговор ) 23:57, 13 сентября 2018 г. (UTC)
- Ну / TAR нормально работает как есть. / Сомнительный - это тот, у которого есть повторы, поэтому это будет для / Сомнительный. Headbomb { t · c · p · b } 03:24, 8 сентября 2018 г. (UTC)
- Может, да. Headbomb { t · c · p · b } 21:43, 14 сентября 2018 г. (UTC)
- Этот до сих пор не реализован. Headbomb { t · c · p · b } 18:37, 6 октября 2018 г. (UTC)
- Да, это то, что я сказал ниже, над которым я собирался работать дальше. ;-) - JLaTondre ( разговор ) 18:41, 6 октября 2018 (UTC)
- Реализованы и загружены исключения на основе редиректов. Пожалуйста, просмотрите. - JLaTondre ( разговор ) 00:17, 7 октября 2018 г. (UTC)
- Этот до сих пор не реализован. Headbomb { t · c · p · b } 18:37, 6 октября 2018 г. (UTC)
- Кажется, работает! Думаю, все, что есть на этой странице, можно заархивировать. У меня есть кое-что еще, но это будет несложно. Headbomb { t · c · p · b } 00:57, 7 октября 2018 г. (UTC)
Обсуждение портала: Шотландия
Здравствуйте, JL-Bot / JLaTondre. Мне интересно, почему ваши недавние обновления признанного контента на Portal Talk: Шотландия больше не включают содержание «Бывшие избранные статьи», «Избранные списки», «Бывшие хорошие статьи» или «Знаете ли вы, «статьи» и другие?
Я заметил, что до редактирования TheTranshumanist эти (и другие элементы) были включены. Является ли это следствием обсуждения в сообществе, о котором я не знал? Жалко, потому что предыдущий контент имел для меня огромную ценность с точки зрения эффективности работы над EN: WP.
Буду признателен за ваш ответ. - Кактус . мужчина ✍ 20:12, 7 октября 2018 г. (UTC)
- В редактировании, на которое вы ссылаетесь, TheTranshumanist удалил эти типы данных из конфигурации бота. Бот предоставляет только те типы, которые требует проект. Поскольку эти типы больше не запрашивались, они больше не предоставлялись. - JLaTondre ( разговор ) 23:00, 7 октября 2018 г. (UTC)
Цели до / 15?
Я наконец обработал и очистил первые 1000 записей WP: JCW / TAR в прошлом месяце или около того. Проходить их один раз за дамп теперь действительно быстро, поэтому мы можем увеличить количество записей до 1500 или даже до 2000 для целей. Headbomb { t · c · p · b } 01:20, 11 октября 2018 г. (UTC)
- Расширен до 1500. Легко перейти на 2000, если вы решите, что хотите этого, посмотрев на 1500. - JLaTondre ( разговор ) 13:46, 13 октября 2018 г. (UTC)
- Спасибо. Мне понадобится время, чтобы набрать новые 500. Множество исключений для настройки, перенаправления для создания, опечаток для отметки, insource: / Foobar / выполняет поиск и очищает ... Headbomb { t · c · p · b } 14:33, 13 октября 2018 г. (UTC)
Методы молекулярной биологии не учитывают методы молекулярной биологии (Клифтон, штат Нью-Джерси) ?
См. Запись № 1022 в WP: JCW / Target11 . Headbomb { t · c · p · b } 14:44, 13 октября 2018 г. (UTC)
- Методы в молекулярной биологии (Клифтон, штат Нью - Джерси) есть
#REDIRECT: [[Methods in Molecular Biology]]
. Это неверный синтаксис, и я удивлен, что перенаправление работает. Я обновил парсер перенаправления, чтобы отловить этот случай. - JLaTondre ( разговор ) 16:56, 13 октября 2018 г. (UTC)
WT: исключение CRAPWATCH
Не могли бы вы сделать исключение для этого . Headbomb { t · c · p · b } 01:10, 14 октября 2018 г. (UTC)
- Обсуждение в Википедии: Академические журналы / журналы WikiProject, цитируемые Wikipedia / Questionable2
- Обсуждение в Википедии: Академические журналы / журналы WikiProject, цитируемые Wikipedia / Questionable3
- Обсуждение в Википедии: Академические журналы / журналы WikiProject, цитируемые Wikipedia / Questionable4
- Обсуждение в Википедии: Академические журналы / журналы WikiProject, цитируемые Википедией / сомнительный5
- Обсуждение в Википедии: Академические журналы / журналы WikiProject, цитируемые Википедией / сомнительный6
- ...
Также все должны быть перенаправлены на обсуждение Википедии: Академические журналы / журналы WikiProject, цитируемые Wikipedia / Questionable1 . Headbomb { t · c · p · b } 01:10, 14 октября 2018 г. (UTC)
- Должно работать. - JLaTondre ( разговор ) 13:34, 14 октября 2018 г. (UTC)
Вопрос по устранению неоднозначности
В 2011 году вы писали: «... [бот] теперь должен правильно определять все варианты (журнал), (журнал) или (газета).», Имея в виду такие случаи, как Nature (журнал) vs Nature , Flight (журнал) ) vs Flight и т. д.
Какие устранители неоднозначности здесь поддерживаются? Потому что было бы полезно, если бы это было расширено, чтобы сказать,
- Журнал> Журнал> Газета> Сайт> База данных> Энциклопедия> Книга> Издательство
Headbomb { t · c · p · b } 22:38, 17 октября 2018 г. (UTC)
- Ух ты, 2011 год! Это было так давно? Это сделали только первые три. Для остальных типов это было легкое расширение. Было всего два изменения. Результаты загружаются сейчас. - JLaTondre ( разговор ) 23:47, 17 октября 2018 г. (UTC)
- Что ж, теперь будет еще несколько, когда я знаю, что это поддерживается. Например, eLS (энциклопедия) , но это, скорее всего, будет в следующей свалке. Надеюсь, это поможет разобраться с остальными вещами CRAPWATCH. Headbomb { t · c · p · b } 00:06, 18 октября 2018 г. (UTC)
Ссылки по категориям
В WP: JCW / C43 у вас есть что-то вроде
{{JCW-row|display=''[[Comput Sci Eng]]''|d-type=i|target=[[Category:Scientific & Academic Publishing academic journals]]|t-type=?|citations=2|articles=1|search=Comput%20Sci%20Eng}}
это должно быть
{JCW-row|display=''[[Comput Sci Eng]]''|d-type=i|target=[[:Category:Scientific & Academic Publishing academic journals]]|t-type=?|citations=2|articles=1|search=Comput%20Sci%20Eng}}
С: перед категорией. Headbomb { t · c · p · b } 22:01, 25 октября 2018 г. (UTC)
- Сделанный. Я сделал то же самое со ссылками File: (вероятно, вряд ли когда-нибудь случится, но на всякий случай). - JLaTondre ( разговор ) 13:32, 27 октября 2018 г. (UTC)
Пропустите обход (журнала), если он помечен {{ R от ненужного разрешения неоднозначности }} / в Категория: Перенаправления из ненужного разрешения неоднозначности
Например, Evol Dev в WP: JCW / E31 использует '' [[Evol Dev (journal) | Evol Dev]] '', и бот получает информацию с бессмысленной страницы ( Evol Dev (журнал) ), а не с хорошей. ( Evol Dev ). Поскольку Evol Dev (журнал) помечен тегом {{ R от ненужного устранения неоднозначности }} / отнесен к категории: перенаправления из ненужного устранения неоднозначности , бот должен просто использовать Evol Dev, как будто Evol Dev (журнал) не существует. Headbomb { t · c · p · b } 13:35, 8 ноября 2018 г. (UTC)
- LOL Вам нравится все усложнять, не так ли? ;-) Не должно быть особых проблем. - JLaTondre ( разговор ) 18:40, 10 ноября 2018 г. (UTC)
- Я не знаю, но люди отказываются удалять эти перенаправления. Headbomb { t · c · p · b } 22:16, 10 ноября 2018 г. (UTC)
- Реализовано. Пара комментариев:
- Evol Dev (журнал) в настоящее время не помечен тегом {{ R от ненужного значения }}. Я вручную отредактировал свой проанализированный набор данных, чтобы бот, когда его обработал, распознавал его как единое целое и правильно устанавливал вывод. Вам нужно будет обновить фактическую страницу, чтобы добавить шаблон до следующего дампа, если вы хотите, чтобы он продолжал это делать.
- При этом я понял, что для этого запроса я реализовал изменение только наполовину. Есть два места в коде, которые затронуты (как подсчитываются вещи и как они выводятся). Я только подсчитал. Я также исправил вывод, что означает, что изменений намного больше, чем в исходных двух.
- Мне все хорошо, но дельт много, так что я могла что-то пропустить. Результаты загружаются. Дай мне знать, если увидишь что-нибудь не так. - JLaTondre ( разговор ) 01:18, 12 ноября 2018 (UTC)
Больше вещей, которые не в счет
Вы знаете, что «Серии» или «Часть» не учитываются для целей сопоставления? Я хоть и «Дополнение» тоже накрыл, но оказалось, что это не так.
Итак, вот еще несколько вещей, которые следует игнорировать для целей сопоставления.
- Дополнение
- Добавка
- Дополнение
- Suppl
- Nouvelle Série
- Новая серия
- NS
- NS
- Neue Folge
- NF
- NF
то есть, если вы найдете Foobar Supplement , Foobar, New Series или Foobar (NF) , они должны быть сгруппированы с Foobar в WP: JCW / TAR (а также WP: JCW / CRAP ). Headbomb { t · c · p · b } 16:40, 5 ноября 2018 г. (UTC)
- Сделанный. Дай мне знать, если увидишь что-нибудь странное. - JLaTondre ( разговор ) 01:11, 7 ноября 2018 (UTC)
- Я взгляну! Пока что, похоже, он делает несколько хороших звукоснимателей. Headbomb { t · c · p · b } 01:39, 7 ноября 2018 г. (UTC)
- Вы также можете добавить «Монографии / Монография / Моногр. / Моногр». Я также обсуждаю, стоит ли добавлять "Letters / Letter / Lett. / Lett." было бы более полезно, чем нет. Проба с материалом "Letters" даст много понимания. Если это не поможет, его можно дергать. Headbomb { t · c · p · b } 14:19, 7 ноября 2018 г. (UTC)
- Версия с обоими загруженными. - JLaTondre ( разговор ) 22:10, 7 ноября 2018 г. (UTC)
- Вы также можете добавить «Монографии / Монография / Моногр. / Моногр». Я также обсуждаю, стоит ли добавлять "Letters / Letter / Lett. / Lett." было бы более полезно, чем нет. Проба с материалом "Letters" даст много понимания. Если это не поможет, его можно дергать. Headbomb { t · c · p · b } 14:19, 7 ноября 2018 г. (UTC)
- Я взгляну! Пока что, похоже, он делает несколько хороших звукоснимателей. Headbomb { t · c · p · b } 01:39, 7 ноября 2018 г. (UTC)
- Есть некоторые проблемы. Такие вещи, как « Письма в природу» перестают использоваться в журнале «Природа» (первая строка различий в [4] ). И такие вещи, как The Powys Review Letters, начали собирать для Physical Review . Headbomb { t · c · p · b } 22:51, 7 ноября 2018 г. (UTC)
- Я не понимаю дела « Письма в природу» . Поскольку это перенаправление к Природе, это не должно быть затронуто. Я исследую это. "The Powys Review" был фактически добавлен к "Physical Review Letters", что имеет смысл. "Physical Review Letters" содержит различные формы "Phys Rev Lett". Если «lett» исключить из них, у вас останется только разница в два символа («rev» и «review» обрабатываются одинаково, «the» также удаляется). - JLaTondre ( разговор ) 23:38, 7 ноября 2018 (UTC)
- Да, второй вариант имеет смысл. Однако в «Письмах к природе» нет. Есть несколько таких случаев, и кажется, что они всегда связаны с ведущими , а не с замыкающими. Могу ошибаться в этой мысли. Headbomb { t · c · p · b } 23:54, 7 ноября 2018 г. (UTC)
- Письма в природу (и подобные случаи) должны быть исправлены. - JLaTondre ( разговор ) 18:25, 10 ноября 2018 г. (UTC)
- Да, второй вариант имеет смысл. Однако в «Письмах к природе» нет. Есть несколько таких случаев, и кажется, что они всегда связаны с ведущими , а не с замыкающими. Могу ошибаться в этой мысли. Headbomb { t · c · p · b } 23:54, 7 ноября 2018 г. (UTC)
- Я не понимаю дела « Письма в природу» . Поскольку это перенаправление к Природе, это не должно быть затронуто. Я исследую это. "The Powys Review" был фактически добавлен к "Physical Review Letters", что имеет смысл. "Physical Review Letters" содержит различные формы "Phys Rev Lett". Если «lett» исключить из них, у вас останется только разница в два символа («rev» и «review» обрабатываются одинаково, «the» также удаляется). - JLaTondre ( разговор ) 23:38, 7 ноября 2018 (UTC)
- Есть некоторые проблемы. Такие вещи, как « Письма в природу» перестают использоваться в журнале «Природа» (первая строка различий в [4] ). И такие вещи, как The Powys Review Letters, начали собирать для Physical Review . Headbomb { t · c · p · b } 22:51, 7 ноября 2018 г. (UTC)
Вроде нормально работает. В качестве примечания, я очистил все до WP: JCW / Target15 . Можно было увеличить до / 20 или даже до / 25. Headbomb { t · c · p · b } 21:58, 13 ноября 2018 г. (UTC)
Странность
- [5] / [6]
Там происходят странные вещи. Headbomb { t · c · p · b } 17:06, 12 ноября 2018 г. (UTC)
- Каким образом? Все они соответствуют логике «Журнал> Журнал> Газета> Веб-сайт> База данных> Энциклопедия> Книга> Издатель». Эти формы являются первыми в этой цепочке ( [7] , [8] , & [9] ), и два перенаправления разрешаются в правильные места. - JLaTondre ( разговор ) 21:45, 12 ноября 2018 г. (UTC)
- Ну, например, старая версия связана со Stylus , страницей- тестом, на которой в качестве возможных записей перечислены как Stylus Magazine, так и The Stylus . Возможно, это просто означает, что необходимо создать Stylus (журнал) и перенаправить его на страницу dab. Я подумаю, теперь, когда я знаю, что происходит. Headbomb { t · c · p · b } 19:26, 13 ноября 2018 г. (UTC)
- [10] это определенно проблема. American Conservative перенаправляет на The American Conservative , но бот считает, что это имеет в виду ссылку на книгу American Conservative . То же самое и с [11] (журнал, в настоящее время аннулированный веб-сайтом). Headbomb { t · c · p · b } 19:36, 13 ноября 2018 г. (UTC)
- Ну, например, старая версия связана со Stylus , страницей- тестом, на которой в качестве возможных записей перечислены как Stylus Magazine, так и The Stylus . Возможно, это просто означает, что необходимо создать Stylus (журнал) и перенаправить его на страницу dab. Я подумаю, теперь, когда я знаю, что происходит. Headbomb { t · c · p · b } 19:26, 13 ноября 2018 г. (UTC)
- Я думаю, что для логики лучше остановиться на «Журнал> Журнал» и забыть «Газета> Веб-сайт> База данных> Энциклопедия> Книга> Издатель». Headbomb { t · c · p · b } 19:45, 13 ноября 2018 г. (UTC)
- Отменил изменения, а также удалил газетный футляр. Повторный запуск сейчас, поэтому обновленные результаты будут немного позже. - JLaTondre ( разговор ) 23:44, 14 ноября 2018 г. (UTC)
- Я думаю, что для логики лучше остановиться на «Журнал> Журнал» и забыть «Газета> Веб-сайт> База данных> Энциклопедия> Книга> Издатель». Headbomb { t · c · p · b } 19:45, 13 ноября 2018 г. (UTC)
- Кстати, ничего не загружено. И если бы вы могли увеличить цели до / 20 или даже / 25. это было бы прекрасно. Headbomb { t · c · p · b } 18:40, 15 ноября 2018 г. (UTC)
- Дня еще немного, не так ли? ;-) Извините, меня прервали. Загружаем сейчас вместе с / 25. - JLaTondre ( разговор ) 23:13, 15 ноября 2018 г. (UTC)
- Еще одна странная вещь, WP: JCW / Target1 дважды перечисляет науку. Один раз с мазком, другой - без. Headbomb { t · c · p · b } 02:29, 16 ноября 2018 г. (UTC)
- Фиксированный. - JLaTondre ( разговор ) 15:43, 18 ноября 2018 г. (UTC)
- Еще одна странная вещь, WP: JCW / Target1 дважды перечисляет науку. Один раз с мазком, другой - без. Headbomb { t · c · p · b } 02:29, 16 ноября 2018 г. (UTC)
- Дня еще немного, не так ли? ;-) Извините, меня прервали. Загружаем сейчас вместе с / 25. - JLaTondre ( разговор ) 23:13, 15 ноября 2018 г. (UTC)
- Кстати, ничего не загружено. И если бы вы могли увеличить цели до / 20 или даже / 25. это было бы прекрасно. Headbomb { t · c · p · b } 18:40, 15 ноября 2018 г. (UTC)
@ JLaTondre : есть какие-нибудь сведения о новом обрабатываемом дампе? Headbomb { t · c · p · b } 20:16, 26 ноября 2018 г. (UTC)
- Праздник отложил это. Должно быть сейчас. - JLaTondre ( разговор ) 12:24, 27 ноября 2018 г. (UTC)
Проблема с Dab?
В WP: JCW / Target3 , запись № 293, РНК связана с РНК вместо РНК (журнал) . Headbomb { t · c · p · b } 01:15, 28 ноября 2018 г. (UTC)
- Проблема вызвана тем, что «РНК (журнал)» и «РНК» нормализуются до «РНК». Однако Rna - это перенаправление на РНК, и не было эквивалента Rna (журнала) (хотя с тех пор вы создали). Когда выполняется обычная нормализация, она выбирает цель «РНК» вместо цели «РНК (журнал)». Я могу легко найти обходной путь для этого случая в общем выводе, но вместо этого я бы предпочел решить логику выбора. Однако, поскольку вы создали перенаправление, проблем со следующим запуском дампа возникнуть не должно. Я все равно посмотрю на него на будущее. - JLaTondre ( разговор ) 22:17, 29 ноября 2018 г. (UTC)
Предполагается, что JL-Bot будет обновлять «Статьи женщин-писателей по качеству и важности»?
- @ Rosiestep : Вы имеете в виду этот стол ? Если это так, это обновлено ботом WP 1.0 ( обсуждение · добавление ), у которого в настоящее время есть некоторые проблемы. В разговоре с Википедией есть некоторая информация : Редакционная группа версии 1.0 / Указатель # Бот заблокирован и Википедия: Боты / Доска объявлений # Отчет об оценке статьи "Бот WP 1.0" ведет себя некорректно , но вкратце: люди смотрят на него (новый оператор Келсон ( говорить · вносить вклад ), если вы хотите связаться с ними о том, где что находится). Headbomb { t · c · p · b } 22:51, 2 января 2019 г. (UTC)
- Да, Headbomb , это таблица, которую нужно обновить. Я свяжусь с Келсоном в соответствии с вашим предложением. - Rosiestep ( разговор ) 22:57, 2 января 2019 г. (UTC)
Не убирать последнюю запятую?
В этой статье у нас есть |journal=The Transactions of the Linnean Society of London, Series 2,
. Однако в WP: JCW / Target10 об этом сообщается как |journal=The Transactions of the Linnean Society of London, Series 2
. Не совсем уверен, почему последняя запятая удалена, но ее следует сохранить. Headbomb { t · c · p · b } 00:29, 7 января 2019 г. (UTC)
- Был специальный шаг по удалению запятых в конце. Я чувствую, что об этом просили, но в архивах ничего не вижу. Я полагаю, что до обработки TAR требовалась некоторая очистка, чтобы удалить некоторые незначительные отличия и сделать больше записей совпадающими (другой вариант - удалить "" в конце). Я удалил запятую и запустил заново. Пожалуйста, посмотрите на результаты и посмотрите, что вы думаете. Я также создам страницу документации, которая описывает все манипуляции (обработка шаблонов, очистка, нормализация и т. Д.). Было бы хорошо иметь список для справок в будущем. Однако на это может уйти пара дней. - JLaTondre ( разговор ) 02:12, 8 января 2019 г. (UTC)
- Я думаю, что это было в основном для WP: JCW / POP, когда это было нашим основным способом определения приоритетов в работе. РГ: JCW / TAR может приблизиться к необработанным записям, чтобы обеспечить очистку и стандартизацию. Запятые и прочий мусор следует убрать на этапе сравнения, но в конечном итоге сообщить об этом. Пробелы все еще можно нормализовать, поскольку читатель этого не увидит. Headbomb { t · c · p · b } 02:18, 8 января 2019 г. (UTC)
- В любом случае, я очистил все экземпляры последних запятых с помощью User: JCW-CleanerBot . Headbomb { t · c · p · b } 02:33, 8 января 2019 г. (UTC)
Вроде переработали все, кроме WP: JCW / TAR, кстати. Headbomb { t · c · p · b } 14:09, 8 января 2019 г. (UTC)
- Я только вчера закончил «обычный» выход. Остальное сейчас работает. - JLaTondre ( разговор ) 23:55, 8 января 2019 г. (UTC)
- Вы тоже вносили некоторые изменения в логику WP: JCW / CRAP ? Несколько раз, когда вы перезапускали бота, вывод изменялся на этой странице, помимо «свежего дампа». Headbomb { t · c · p · b } 04:34, 9 января 2019 г. (UTC)
- Нет, для сомнительной обработки не было никаких изменений в логике. Любые изменения будут результатом предшествующих изменений данных или настроек вашей конфигурации. - JLaTondre ( разговор ) 00:18, 10 января 2019 г. (UTC)
- Вы тоже вносили некоторые изменения в логику WP: JCW / CRAP ? Несколько раз, когда вы перезапускали бота, вывод изменялся на этой странице, помимо «свежего дампа». Headbomb { t · c · p · b } 04:34, 9 января 2019 г. (UTC)
- Что же вызывает такие изменения, как [12] (см., Например, кучу открытых журналов в Bentham Science Publishers)? Потому что я не вижу в настройках конфигурации ничего, что могло бы вызвать это. Headbomb { t · c · p · b } 00:42, 10 января 2019 г. (UTC)
- Точно сказать не могу. Удаленные открытые журналы - это дублирующиеся журналы (согласно разделу выше). Версии редиректа остались. Однако я не развернул никаких изменений, которые должны были бы вызвать это, и я не вижу никаких изменений на самих страницах. В настоящее время я заменяю существующий код для повышения скорости и удаляю оставшиеся дубликаты, чтобы не тратить время на его изоляцию в старой версии. - JLaTondre ( разговор ) 19:15, 13 января 2019 г. (UTC)
- Что же вызывает такие изменения, как [12] (см., Например, кучу открытых журналов в Bentham Science Publishers)? Потому что я не вижу в настройках конфигурации ничего, что могло бы вызвать это. Headbomb { t · c · p · b } 00:42, 10 января 2019 г. (UTC)
/ r / наука
В то время как [[/ r / science]] хорош в основном пространстве, в пространстве Википедии это вызывает проблемы. [[: / r / science]] потребуется.
Смотрите строку, которая гласит
- Новый американец (3 в 3: 1 , 2 , 3 )
в WP: JCW / Questionable2 . Могут применяться и в других местах. Headbomb { t · c · p · b } 00:56, 11 февраля 2019 г. (UTC)
- Фиксированный. - JLaTondre ( разговор ) 23:31, 11 февраля 2019 г. (UTC)
- Похоже, это тоже вызвало некоторые странные побочные изменения. Две странные правки: [13] , [14] . В остальном все было хорошо. Headbomb { t · c · p · b } 07:44, 12 февраля 2019 г. (UTC)
- Также, когда бот создает переадресацию для обсуждения Questionable8, возникают некоторые проблемы [15] . Headbomb { t · c · p · b } 07:46, 12 февраля 2019 г. (UTC)
- Исправлены редиректы. - JLaTondre ( разговор ) 20:45, 15 февраля 2019 г. (UTC)
- Также, когда бот создает переадресацию для обсуждения Questionable8, возникают некоторые проблемы [15] . Headbomb { t · c · p · b } 07:46, 12 февраля 2019 г. (UTC)
Бот, похоже, игнорирует ненадежные поля, зеркала и вилки в WP: CRAPWATCH / SETUP
Например, есть
- Нетрадиционная медицина
- ...
- Категория: Журналы по альтернативной и традиционной медицине
- ...
и
- Википедия: Зеркала и вилки
- ...
- ScienceDaily
- ...
дерево выбора там. Но я нигде не вижу разделов «Альтернативная медицина» или «Википедия: зеркала и вилки» в WP: CRAPWATCH , несмотря на то, что многие из этих журналов и публикаций цитируются. Headbomb { t · c · p · b } 16:18, 8 февраля 2019 г. (UTC)
- Потому что эти разделы не соответствуют правильному синтаксису. {{JCW-selected}} должен стоять в начале строки, как в User: JL-Bot / Questionable.cfg # Journals . Все остальное игнорируется (чтобы не выбирать документацию ранее на странице и т. Д.). В этих двух разделах указаны записи * {{JCW-selected}}, которые не будут выбраны. Звездочка является избыточной, поскольку шаблон добавляет ее. Я удалю их и перезапущу сомнительную обработку. - JLaTondre ( разговор ) 16:33, 9 февраля 2019 г. (UTC)
- Вау, мозг пердит на этом. Спасибо, что нашли! Headbomb { t · c · p · b } 17:49, 9 февраля 2019 г. (UTC)
- Я установил кучу новых исключений, чтобы справиться с новым притоком. Если бы вы могли повторить попытку, когда у вас будет время, это было бы здорово. Headbomb { t · c · p · b } 21:36, 9 февраля 2019 г. (UTC)
- Сделанный. - JLaTondre ( разговорное ) 20:19, 10 февраля 2019 (UTC)
- Я установил кучу новых исключений, чтобы справиться с новым притоком. Если бы вы могли повторить попытку, когда у вас будет время, это было бы здорово. Headbomb { t · c · p · b } 21:36, 9 февраля 2019 г. (UTC)
- Не могли бы вы попробовать еще раз, когда у вас будет такая возможность. Ничего особенного, поэтому, если у вас есть несколько обновлений кода, запланированных в ближайшие несколько дней, это может подождать до тех пор, но хорошо иметь обновленную базовую линию после больших обновлений WP: CRAPWATCH / SETUP + Пользователь: JL-Bot /Citations.cfg . Headbomb { t · c · p · b } 09:13, 11 февраля 2019 г. (UTC)
- Бег. Будет исправлено / r / science. - JLaTondre ( разговор ) 23:32, 11 февраля 2019 г. (UTC)
- Не могли бы вы попробовать еще раз, когда у вас будет такая возможность. Ничего особенного, поэтому, если у вас есть несколько обновлений кода, запланированных в ближайшие несколько дней, это может подождать до тех пор, но хорошо иметь обновленную базовую линию после больших обновлений WP: CRAPWATCH / SETUP + Пользователь: JL-Bot /Citations.cfg . Headbomb { t · c · p · b } 09:13, 11 февраля 2019 г. (UTC)
- И еще один пробег? Скорее всего, это будет последний, необходимый для обновления кода / следующего дампа. Также не стесняйтесь увеличивать цели до / 30. Headbomb { t · c · p · b } 06:52, 15 февраля 2019 г. (UTC)
- В процессе. - JLaTondre ( разговор ) 20:46, 15 февраля 2019 г. (UTC)
- И еще один пробег? Скорее всего, это будет последний, необходимый для обновления кода / следующего дампа. Также не стесняйтесь увеличивать цели до / 30. Headbomb { t · c · p · b } 06:52, 15 февраля 2019 г. (UTC)
Незначительная доработка для следующего прогона
Вместо
{{JournalsMain}}{{JournalsLetter | letter = Questionable}}
просто делать
{{JCW-Main | letter = Под вопросом}}
То же и с журналами. Я обновил {{ JCW-Main }}, чтобы при необходимости вызывать {{ JCW-Letter }}. Headbomb { t · c · p · b } 04:46, 16 февраля 2019 г. (UTC)
- Кроме того, похоже, нет смысла иметь отдельные шаблоны {{ JCW-exclude }} / {{ MCW-exclude }}, поэтому я бы предложил исключить элементы из обоих списков, используя любой из шаблонов (т. Е. Если {{ JCW-exclude } }, исключить объекты из списков JCW / TAR и MWC / TAR, а если используется {{ MCW-exclude }}, исключить объекты из списков JCW / TAR и MCW / TAR.). Могут быть и угловые случаи, но я их еще не нашел. Headbomb { t · c · p · b } 07:12, 16 февраля 2019 г. (UTC)
- Хорошо. - JLaTondre ( разговор ) 21:35, 17 февраля 2019 г. (UTC)
- После перемещения страницы обновляется до «JCW-Main». Headbomb { t · c · p · b } 08:44, 23 февраля 2019 г. (UTC)
- Точно так же {{ JournalsPrevNext }} теперь {{ JCW-PrevNext }}. Структура MCW также была обновлена с использованием тех же соглашений, с MCW вместо JCW. См. Раздел Категория: журналы, цитируемые шаблонами Википедии . Headbomb { t · c · p · b } 20:20, 23 февраля 2019 г. (UTC)
- Оба эти изменения (игнорируются и шаблоны) были реализованы при последнем запуске. - JLaTondre ( разговор ) 11:33, 26 февраля 2019 г. (UTC)
- Точно так же {{ JournalsPrevNext }} теперь {{ JCW-PrevNext }}. Структура MCW также была обновлена с использованием тех же соглашений, с MCW вместо JCW. См. Раздел Категория: журналы, цитируемые шаблонами Википедии . Headbomb { t · c · p · b } 20:20, 23 февраля 2019 г. (UTC)
- После перемещения страницы обновляется до «JCW-Main». Headbomb { t · c · p · b } 08:44, 23 февраля 2019 г. (UTC)
WP: CRAPWATCH твик
Я дал большое, серьезное расширение WP: CRAPWATCH / SETUP, и теперь список составлен из нескольких источников. Не могли бы вы взять |source=
/ |note=
параметры {{ JCW-selected }} и добавить его к цели в списке? Например, что-то вроде
Классифицировать | Цель / группа ( источник ) | Записи (цитаты, статьи) | Всего цитирований | Отличные статьи |
---|---|---|---|---|
24 | Обзоры фармакогнозии [-] |
| 31 год | 31 год |
Headbomb { t · c · p · b } 04:44, 5 февраля 2019 г. (UTC)
- Да, это достаточно легко сделать. Я внесу изменения в предыдущие запросы. Однако этого все равно будет немного, так как мне нужно найти свободное время, чтобы поработать над всеми ними. - JLaTondre ( разговор ) 12:40, 7 февраля 2019 г. (UTC)
- Не волнуйтесь. Я надеялся, что это немного изменит приоритеты, так как это должно быть довольно быстро, и crapwatch / setup получили огромное расширение, но я также думаю, что, возможно, пришло время преобразовать crapwatch в шаблон -основанное решение, как мы делаем с {{ JCW-row }}, поэтому оно может сэкономить ваше время, чтобы реализовать это вместе с новым форматом вместо того, чтобы делать это дважды. Headbomb { t · c · p · b } 12:51, 7 февраля 2019 г. (UTC)
- Обратите внимание, что этот запрос теперь избыточен с # Новый формат для страниц TAR и CRAP ниже. Headbomb { t · c · p · b } 01:22, 3 марта 2019 г. (UTC)
- Не волнуйтесь. Я надеялся, что это немного изменит приоритеты, так как это должно быть довольно быстро, и crapwatch / setup получили огромное расширение, но я также думаю, что, возможно, пришло время преобразовать crapwatch в шаблон -основанное решение, как мы делаем с {{ JCW-row }}, поэтому оно может сэкономить ваше время, чтобы реализовать это вместе с новым форматом вместо того, чтобы делать это дважды. Headbomb { t · c · p · b } 12:51, 7 февраля 2019 г. (UTC)
Повторяющийся листинг в WP: JCW / CRAP
В записи MDPI у вас есть
- Журнал сердечно-сосудистого развития и заболеваний (1 в 1: 1)
а потом позже
- Список академических журналов MDPI
- ...
- Журнал сердечно-сосудистого развития и заболеваний (1 в 1: 1)
- ...
Нужен только второй.
Точно так же у вас есть
- Растения (журнал)
- Журнал Places (11 из 9)
- Журнал плана (2 в 2: 1, 2)
Что лучше всего указать как
- Список академических журналов MDPI
- ...
- Растения (журнал)
- Журнал Places (11 из 9)
- Журнал плана (2 в 2: 1, 2)
- ...
Headbomb { t · c · p · b } 01:06, 7 октября 2018 г. (UTC)
- Чтобы прояснить, это не та «легкая» вещь, которую я имел в виду выше. Headbomb { t · c · p · b } 01:07, 7 октября 2018 г. (UTC)
Я полагаю, вы могли бы резюмировать желаемую структуру как
- Уровень 1 (без перенаправления)
- Уровень 2 (2a → перенаправляет на Уровень 1; 2b → опечатки и варианты уровня 1)
- Уровень 3 (опечатки и варианты Уровня 2а)
- Уровень 2 (2a → перенаправляет на Уровень 1; 2b → опечатки и варианты уровня 1)
Headbomb { t · c · p · b } 01:12, 7 октября 2018 г. (UTC)
Например, № 13 (e-Century Publishing Corporation) должен отображаться как
Классифицировать | Цель / Группа | Записи (цитаты, статьи) | Всего цитирований | Отличные статьи |
---|---|---|---|---|
13 | Издательская корпорация e-Century |
| 147 | 136 |
Грубо говоря. Headbomb { t · c · p · b } 15:08, 9 октября 2018 г. (UTC)
- Случай «Журнал сердечно-сосудистого развития и заболеваний» происходит из-за того, что конфигурация запрашивает как Список академических журналов MDPI (на который выполняется перенаправление), так и Категория: академические журналы MDPI (членом которых он является). Я все еще думаю, как сделать доработку группы как описано выше. Это будет тот случай, который будет рассматриваться как часть этого. - JLaTondre ( разговор ) 23:23, 10 октября 2018 г. (UTC)
- Получить записи, удалить дубликаты, обработать? Headbomb { t · c · p · b } 01:15, 11 октября 2018 г. (UTC)
Я считаю, что обнаружение дубликатов - одна из немногих оставшихся вещей, которые необходимо реализовать. Headbomb { t · c · p · b } 18:10, 3 ноября 2018 г. (UTC)
- Сделанный. - JLaTondre ( разговор ) 21:29, 11 марта 2019 г. (UTC)
Вестник Музея естествознания
В WP: JCW / Target8 , Bulletin of the Natural History Museum отсутствует довольно много записей.
Например, Бык. Br. Mus. (nat. Hist.) (Ent.) в WP: JCW / B31 не используется, хотя он очень близок к Bull. Br. Mus. (Nat. Hist.) Ent. . Отличаются только пунктуацией (скобки) и заглавными буквами. Headbomb { t · c · p · b } 06:27, 24 января 2019 г. (UTC)
- Это верно. Бык. Br. Mus. (Nat. Hist.) Ent. не цитируется Википедией, поэтому не будет совпадать. TAR ищет общие цели в цитатах. Он не использует цитирование для сравнения. - JLaTondre ( разговор ) 23:44, 24 января 2019 г. (UTC)
- Как это не цитируется? «Бык. Br. Mus. (nat. Hist.) (Ent.) »перечислено в WP: JCW / B31 как процитировано, и это было так . Это вариант Bull с опечаткой . Br. Mus. (Nat. Hist.) Ent. который перенаправляет на Бюллетень Музея естественной истории , поэтому его следует перегруппировать с целью Бюллетеня Музея естественной истории . Если сейчас все работает не так, значит, так и должно работать. Headbomb { t · c · p · b } 01:14, 25 января 2019 г. (UTC)
- Бык. Br. Mus. (Nat. Hist.) Ent. не цитируется. Тот факт, что это перенаправление, не имеет отношения к текущей обработке. Запрос на TAR заключался в том, чтобы сгруппировать общие цели среди цитат на страницах WP: JCW / ALPHA. Если его нет на этих страницах, он не включается в обработку TAR. Если вы хотите начать включать перенаправления, это можно сделать, но в настоящее время это правильно, исходя из исходных спецификаций. - JLaTondre ( разговор ) 02:21, 25 января 2019 (UTC)
- Как это не цитируется? «Бык. Br. Mus. (nat. Hist.) (Ent.) »перечислено в WP: JCW / B31 как процитировано, и это было так . Это вариант Bull с опечаткой . Br. Mus. (Nat. Hist.) Ent. который перенаправляет на Бюллетень Музея естественной истории , поэтому его следует перегруппировать с целью Бюллетеня Музея естественной истории . Если сейчас все работает не так, значит, так и должно работать. Headbomb { t · c · p · b } 01:14, 25 января 2019 г. (UTC)
Ну это не так, как я помню , делающий запрос в тогда , но это может быть просто неясность / неоднозначность в первоначальной редакции. Неважно, общая желаемая логика
- Найдите "цели" (например, не перенаправления и целевые страницы)
- Для каждой цели перегруппируйте как прямые «совпадения» (целевые записи, плюс все, что перенаправляет на цель), так и косвенные совпадения (варианты и опечатки прямых совпадений).
- Исключение вещей из списка исключений и вещей без совпадений.
Headbomb { t · c · p · b } 02:36, 25 января 2019 г. (UTC)
- Сделанный. - JLaTondre ( разговор ) 21:30, 11 марта 2019 г. (UTC)
Новый формат для страниц TAR и CRAP
Если бы вы могли реализовать эти новые форматы для страниц TAR (см. [16] ) и CRAP (см. [17] ), это было бы здорово. Headbomb { t · c · p · b } 22:42, 27 февраля 2019 г. (UTC)
- Однако новый формат даты (20120220 → 2012-02-20) должен применяться повсеместно. Headbomb { t · c · p · b } 23:01, 27 февраля 2019 г. (UTC)
- Никаких обещаний, но в эти выходные у меня будет время, чтобы закончить обновленную версию. Если да, я также включу новый формат. - JLaTondre ( разговор ) 02:36, 28 февраля 2019 г. (UTC)
- С нетерпением жду этого. Новый формат должен упростить настройку внешнего вида без вашего участия, но также упростит просмотр различий. Headbomb { t · c · p · b } 02:39, 28 февраля 2019 г. (UTC)
- Фактически, вместо этого вы можете напрямую указать дату в {{ JCW-date }}. В {{ JCW-bottom }} больше не требуется . Headbomb { t · c · p · b } 02:37, 5 марта 2019 г. (UTC)
- Вы имеете в виду редактировать страницу {{ JCW-date }}? Зачем добавлять дополнительное редактирование страницы? - JLaTondre ( разговор ) 16:31, 10 марта 2019 г. (UTC)
- Идея состоит в том, что его можно использовать на других страницах, и его легче читать другим ботам, таким как User: RonBot . Технически JCW-bottom все еще может использоваться как есть (в случае, если бот останавливает промежуточный запуск или что-то в этом роде), но JCW-date более полезен, поскольку его можно включить на другие страницы, такие как основная страница WP: JCW . Headbomb { t · c · p · b } 20:50, 10 марта 2019 г. (UTC)
- Сделанный. - JLaTondre ( разговор ) 21:37, 11 марта 2019 г. (UTC)
- Идея состоит в том, что его можно использовать на других страницах, и его легче читать другим ботам, таким как User: RonBot . Технически JCW-bottom все еще может использоваться как есть (в случае, если бот останавливает промежуточный запуск или что-то в этом роде), но JCW-date более полезен, поскольку его можно включить на другие страницы, такие как основная страница WP: JCW . Headbomb { t · c · p · b } 20:50, 10 марта 2019 г. (UTC)
- Вы имеете в виду редактировать страницу {{ JCW-date }}? Зачем добавлять дополнительное редактирование страницы? - JLaTondre ( разговор ) 16:31, 10 марта 2019 г. (UTC)
- Фактически, вместо этого вы можете напрямую указать дату в {{ JCW-date }}. В {{ JCW-bottom }} больше не требуется . Headbomb { t · c · p · b } 02:37, 5 марта 2019 г. (UTC)
- С нетерпением жду этого. Новый формат должен упростить настройку внешнего вида без вашего участия, но также упростит просмотр различий. Headbomb { t · c · p · b } 02:39, 28 февраля 2019 г. (UTC)
Африканский журнал традиционных, дополнительных и альтернативных лекарств не получил?
В WP: CRAPWATCH / SETUP есть
- Нетрадиционная медицина
- ...
- Категория: Журналы по альтернативной и традиционной медицине
- ...
В категории «Журналы альтернативной и традиционной медицины» есть « Африканский журнал традиционных, дополнительных и альтернативных лекарств» .
Afr J Tradit Complement Altern Med перенаправляет на Африканский журнал традиционных, дополнительных и альтернативных лекарств , но не упоминается в статье «Альтернативная медицина» в WP: JCW / Questionable1 (# 6).
Headbomb { t · c · p · b } 01:30, 11 февраля 2019 г. (UTC)
- Это связано с тем, что Африканский журнал традиционных, дополнительных и альтернативных лекарственных средств указан в разделе конфигурации журнала. Он и его перенаправление отображаются как 52 на WP: JCW / Questionable2 . Поскольку сомнительная обработка основана на общей целевой обработке, у нее нет концепции разрешения чего-либо на две цели. Это нужно? Или вы можете жить с ненадежной конфигурацией полей, которая является уловкой для всех, а раздел конфигурации журнала фактически заменяет собой, когда вам нужен конкретный список? - JLaTondre ( разговор ) 23:39, 11 февраля 2019 г. (UTC)
- Ну, это не суперкритично, пока его подбирают, это приоритет номер один. Но было бы полезно, чтобы он был указан в обоих местах. Вроде как, если журнал OMICS шарлатанской медицины получает отдельную запись, он не перестает быть журналом OMICS, журналом шарлатанской медицины или чем-то, что индивидуально называли дерьмом. Таким образом, люди, заинтересованные в очистке OMICS, найдут это под записью OMICS, люди, заинтересованные в очистке шарлатанской медицины, найдут ее под записью шарлатанской медицины, и как отдельная организация ее можно будет отследить до той организации, которая назвала это дерьмом. Headbomb { t · c · p · b } 23:48, 11 февраля 2019 г. (UTC)
- Хорошо, мне нужно перекусить и просто переписать целевую обработку. Таким образом я могу решить все эти вопросы / запросы. - JLaTondre ( разговор ) 20:45, 15 февраля 2019 г. (UTC)
- Ну, это не суперкритично, пока его подбирают, это приоритет номер один. Но было бы полезно, чтобы он был указан в обоих местах. Вроде как, если журнал OMICS шарлатанской медицины получает отдельную запись, он не перестает быть журналом OMICS, журналом шарлатанской медицины или чем-то, что индивидуально называли дерьмом. Таким образом, люди, заинтересованные в очистке OMICS, найдут это под записью OMICS, люди, заинтересованные в очистке шарлатанской медицины, найдут ее под записью шарлатанской медицины, и как отдельная организация ее можно будет отследить до той организации, которая назвала это дерьмом. Headbomb { t · c · p · b } 23:48, 11 февраля 2019 г. (UTC)
- Это (частично) уже было переписано? Он находит ... новые вещи, такие как Википедия: академические журналы / журналы WikiProject, цитируемые Wikipedia / Target10 ( онкология , запись № 975). Headbomb { t · c · p · b } 03:47, 16 февраля 2019 г. (UTC)
- Пара экспериментальных настроек, ничего определенного. Полная перезапись все еще продолжается. - JLaTondre ( разговор ) 21:34, 17 февраля 2019 г. (UTC)
- Это (частично) уже было переписано? Он находит ... новые вещи, такие как Википедия: академические журналы / журналы WikiProject, цитируемые Wikipedia / Target10 ( онкология , запись № 975). Headbomb { t · c · p · b } 03:47, 16 февраля 2019 г. (UTC)
Просто удостоверился, что я не сумасшедший или не сделал где-нибудь что-то странное. Они хорошие пикапы, так что что бы вы ни делали, это хорошая поправка. Не стесняйтесь повторять каждый раз, когда настраиваете, я всегда проверяю. Плюс почти все остальные исключения для CRAPWATCH были настроены (не все, но все очевидное). Конечная часть ложных срабатываний должна исчезнуть. Headbomb { t · c · p · b } 22:50, 17 февраля 2019 г. (UTC)
- Необходимо проверить это (разрешение страницы на несколько сомнительных целей) после загрузки последних результатов. Основываясь на обновлениях, я думаю, что сейчас он должен работать так, как хотелось бы, но у меня не было этого в моем письменном списке при внесении изменений, поэтому я специально ничего для этого не делал. - JLaTondre ( разговор ) 21:36, 11 марта 2019 г. (UTC)
- Сделанный. - JLaTondre ( разговор ) 23:48, 11 марта 2019 г. (UTC)
Черновик указателя: Пользователь: Headbomb / Crapwatch
В настоящее время пишу черновик статьи с указателем о Crapwatch. Обратная связь приветствуется. Я не планирую отправлять его для публикации до тех пор, пока, по крайней мере, пользователь не поговорит: JL-Bot # WP: настройка CRAPWATCH будет учтена, и вы дадите мне большой палец вверх, но я мог бы задержаться и дольше, в зависимости от того, когда возникнут другие проблемы взяться за дело. Headbomb { t · c · p · b } 10:07, 26 февраля 2019 г. (UTC)
- Единственная моя рекомендация - изменить предложение, которое гласит: « Большинство ложных срабатываний можно обойти вручную, и компиляция будет соответствующим образом обновлена при следующем запуске бота». «Может быть». Ложные срабатывания можно идентифицировать вручную и добавлять в конфигурацию, чтобы что они будут удалены в будущих запусках ботов "? Просто чтобы уточнить, что настройка выполняется вручную, а фактический обход - нет. Первоначальная формулировка может показаться неоднозначной для человека, не знакомого с ней. Кроме того, спасибо за крик. - JLaTondre ( разговор ) 23:18, 11 марта 2019 г. (UTC)
- Изменено на «Однако ложные срабатывания можно идентифицировать вручную , и компиляция будет соответствующим образом обновлена при будущих запусках бота». Headbomb { t · c · p · b } 02:48, 12 марта 2019 г. (UTC)
Март 2019 г.
Привет. Это сообщение, информирующее вас о том, что один или несколько ваших недавних вкладов , таких как редактирование, внесенное вами в Portal: Architecture , не кажутся конструктивными и были отменены . Найдите время, чтобы ознакомиться с нашими правилами и правилами . Вы можете найти информацию об этом на нашей странице приветствия, которая также предоставляет дополнительную информацию о конструктивном вкладе в эту энциклопедию . Если вы хотели внести только тестовые правки, используйте для этого песочницу . Если вы думаете, что я совершил ошибку, или если у вас есть вопросы, вы можете оставить сообщение на моей странице обсуждения. Пожалуйста, не спамите обширные неизбирательные списки ссылок на страницу портала Brown HairedGirl (обсуждение) • ( вклад ) 02:39, 16 марта 2019 г. (UTC)
- @ BrownHairedGirl : вы знаете, что JL-Bot - это бот, которого специально попросили сделать это, верно? И будет продолжать повторно добавлять этот контент каждую неделю, потому что, опять же, его попросили включить. См. WP: RECOG . Headbomb { t · c · p · b } 03:19, 16 марта 2019 г. (UTC)
- @ Headbomb : да, спасибо, я знал. Сюда меня привел Твинкл, поэтому я решил оставить здесь записку в качестве первого шага. Некоторый проект или где-то нужно уведомить об изменении инструкций бота, но я не уверен, где. - Brown HairedGirl (обсуждение) • ( вклад ) 03:25, 16 марта 2019 г. (UTC)
- Трансгуманист добавил его на эту страницу. Вам нужно будет либо отменить это изменение и удалить конфигурацию, либо обсудить это с ним. - JLaTondre ( разговор ) 12:48, 16 марта 2019 г. (UTC)
- @ Headbomb : да, спасибо, я знал. Сюда меня привел Твинкл, поэтому я решил оставить здесь записку в качестве первого шага. Некоторый проект или где-то нужно уведомить об изменении инструкций бота, но я не уверен, где. - Brown HairedGirl (обсуждение) • ( вклад ) 03:25, 16 марта 2019 г. (UTC)
Странная проблема с изображением / файлом
Запись № 2923 в WP: JCW / Target30 ( Animage ) содержит следующие записи
- Файл: Журнал фотографии дома Джорджа Истмана
- Файл: Журнал стипендий для медсестер
Там есть интервики-проблема, но фактические записи - это Image: The Journal of Nursing Scholarship и Image: Journal of Photography of the George Eastman House . Headbomb { t · c · p · b } 06:51, 15 марта 2019 г. (UTC)
- Взгляните на исходный код страницы. Фактическая перечисленная запись - «Изображение: Журнал фотографии дома Джорджа Истмана» в соответствии с шаблоном. Когда страницы Image: связаны, программное обеспечение вики автоматически преобразует их для отображения File: (унаследованное от того, когда пространство имен Image: было переименовано в File :). К счастью, это были не настоящие изображения, если бы они были отображены. Я могу поставить перед ними префикс «:», чтобы изображение не отображалось (если оно было на самом деле) и предотвращалось автоматическое преобразование (например, изображение: The Journal of Nursing Scholarship ). - JLaTondre ( разговор ) 21:08, 15 марта 2019 г. (UTC)
- Приставка кажется правильным решением. Headbomb { t · c · p · b } 03:17, 16 марта 2019 г. (UTC)
- Сделанный. Обработаю и отправлю. - JLaTondre ( разговор ) 16:59, 16 марта 2019 г. (UTC)
- Приставка кажется правильным решением. Headbomb { t · c · p · b } 03:17, 16 марта 2019 г. (UTC)
Цитата Новая версия Live
Обновление обработки цитирования завершено. Они включают:
- Обработка Popular Targets (TAR) теперь также ищет перенаправления на цель, даже если перенаправление не является цитированием.
- В выводе TAR и сомнительных целей (CRAP) теперь используются шаблоны
- Сопоставление нормализации TAR и CRAP было улучшено, чтобы уловить некоторые случаи, которые могли быть пропущены
- Страницы TAR и CRAP теперь содержат временные метки страницы (страниц) конфигурации, использованной для запуска (возможно, потребуется переместить это в шаблон).
- Дубликаты CRAP на выходе теперь удалены
- Вывод CRAP теперь включает поля "Источник" и "Примечания".
- Улучшена идентификация перенаправлений на страницы значений неоднозначности.
- Код был переработан, чтобы (надеюсь) упростить будущие обновления с менее неожиданными взаимодействиями.
Вывод из новой версии сейчас сохраняется. Он был сгенерирован вчера (я хотел быть рядом, когда он загружает результаты, чтобы я мог его отслеживать), поэтому в нем будут отсутствовать последние изменения файла конфигурации. Однако первый пункт выше приведет к большему количеству ложных срабатываний, которые необходимо подавить (например, Nat. Перенаправляет на Nature, который соответствует At , MAT , NA и т. Д.). Как только ложные срабатывания будут обновлены на основе этого прогона, дайте мне знать здесь, и я перезапущу его. Также дайте мне знать, если увидите что-нибудь неожиданное. - JLaTondre ( разговор ) 21:27, 11 марта 2019 г. (UTC)
- Я взгляну. Первое, что бросается в глаза, это в таких различиях [18] , что лишние '(journal)' (и связанные с ними поиски) кажутся ... ненужными, а иногда и вредными. Делает целевой столбец для Molecular Phylogenetics and Evolution похожим на перенаправление, например, когда этого не должно быть. Старое поведение там было лучше. Headbomb { t · c · p · b } 00:36, 12 марта 2019 г. (UTC)
- Я изменил его, чтобы удалить "(журнал | журнал)" из поисков. Для цели он игнорировал перенаправления, помеченные как ненужные. Я обновил его, чтобы игнорировать перенаправление "TITLE (journal | magazine)", которое указывает на "TITLE". Я думаю, что это было оригинальное поведение. - JLaTondre ( разговор ) 02:23, 12 марта 2019 г. (UTC)
- Я взгляну. Первое, что бросается в глаза, это в таких различиях [18] , что лишние '(journal)' (и связанные с ними поиски) кажутся ... ненужными, а иногда и вредными. Делает целевой столбец для Molecular Phylogenetics and Evolution похожим на перенаправление, например, когда этого не должно быть. Старое поведение там было лучше. Headbomb { t · c · p · b } 00:36, 12 марта 2019 г. (UTC)
- О боже, TAR / CRAP - это беспорядок. Кажется, что отсутствует шаг «если он существует и не указывает на цель, это не совпадение». Например, нормально, если At не существует. Но At существующий и не указывающий на Nature (журнал) должен исключить At из совпадений. Точно так же в записи TAR для New Scientist (# 6) он соответствует вещам, которые явно не указывают на New Scientist, таким как NEWSru , Science (журнал) , Sun Journal и News24 . Все они должны быть отфильтрованы и относительно рано, чтобы вы не усугубляли проблему, ища варианты NEWSru , Sun Journal и т. Д. Для New Scientist . Headbomb { t · c · p · b } 00:40, 12 марта 2019 г. (UTC)
Nat. redirects to Nature (journal), which matches At
- Ух, я пропустил эту проверку в предыдущей версии. Вставляю обратно и запускаю. Надеюсь, следующая версия будет выглядеть лучше. Извини за это! - JLaTondre ( разговор ) 02:23, 12 марта 2019 г. (UTC)
- Это не может не выглядеть лучше , ха - ха. У меня будут еще комментарии, но на данный момент трудно даже прочитать компиляцию и выяснить, что хорошо / плохо. Новые шаблонные версии кажутся прекрасными в том, что касается структуры, хотя некоторые сопоставления CRAP, вероятно, нуждаются в некоторой доработке. Я узнаю больше, когда будет загружена новая загрузка. Headbomb { t · c · p · b } 02:36, 12 марта 2019 г. (UTC)
- Ух, я пропустил эту проверку в предыдущей версии. Вставляю обратно и запускаю. Надеюсь, следующая версия будет выглядеть лучше. Извини за это! - JLaTondre ( разговор ) 02:23, 12 марта 2019 г. (UTC)
- О боже, TAR / CRAP - это беспорядок. Кажется, что отсутствует шаг «если он существует и не указывает на цель, это не совпадение». Например, нормально, если At не существует. Но At существующий и не указывающий на Nature (журнал) должен исключить At из совпадений. Точно так же в записи TAR для New Scientist (# 6) он соответствует вещам, которые явно не указывают на New Scientist, таким как NEWSru , Science (журнал) , Sun Journal и News24 . Все они должны быть отфильтрованы и относительно рано, чтобы вы не усугубляли проблему, ища варианты NEWSru , Sun Journal и т. Д. Для New Scientist . Headbomb { t · c · p · b } 00:40, 12 марта 2019 г. (UTC)
- В будущих запусках используйте формат ISO для дат. ( https://en.wikipedia.org/w/index.php?title=Template:JCW-date&curid=60140457&diff=887330264&oldid=886911175 ). Headbomb { t · c · p · b } 02:42, 12 марта 2019 г. (UTC)
- Он все еще добавляет дополнительные данные для поиска [19] . Однако это не критическое исправление, требующее повторного запуска. Headbomb { t · c · p · b } 08:23, 12 марта 2019 г. (UTC)
- Это действительно должно быть исправлено сейчас, но будет ждать следующего запуска, чтобы загрузить. - JLaTondre ( разговор ) 01:25, 13 марта 2019 г. (UTC)
- Я загрузил несколько страниц журнала / A, чтобы проверить исправление, но не весь набор. Сделаю это, когда все остальное будет хорошо выглядеть. - JLaTondre ( разговор ) 01:47, 14 марта 2019 г. (UTC)
- Сделанный. - JLaTondre ( разговор ) 17:32, 14 марта 2019 г. (UTC)
- Я загрузил несколько страниц журнала / A, чтобы проверить исправление, но не весь набор. Сделаю это, когда все остальное будет хорошо выглядеть. - JLaTondre ( разговор ) 01:47, 14 марта 2019 г. (UTC)
- Это действительно должно быть исправлено сейчас, но будет ждать следующего запуска, чтобы загрузить. - JLaTondre ( разговор ) 01:25, 13 марта 2019 г. (UTC)
- Он все еще добавляет дополнительные данные для поиска [19] . Однако это не критическое исправление, требующее повторного запуска. Headbomb { t · c · p · b } 08:23, 12 марта 2019 г. (UTC)
- В будущих запусках используйте формат ISO для дат. ( https://en.wikipedia.org/w/index.php?title=Template:JCW-date&curid=60140457&diff=887330264&oldid=886911175 ). Headbomb { t · c · p · b } 02:42, 12 марта 2019 г. (UTC)
Новая версия, часть 2
Хорошо, теперь, когда загруженная версия имеет больше смысла, мы можем читать вещи более разумно.
Во-первых, очевидно, что алгоритм сопоставления слишком агрессивен, когда речь идет о «маленьких» именах, поэтому его нужно деагрессивировать. Например, "Астрофизический журнал" соответствует
- CAN журнал
- Журнал CAP
- CAPjournal
- CD журнал
- CE журнал
- CW Журнал
- Журнал EPA
- Журнал ФАО
- ГАЗ Журнал
- Газовый журнал
- ИК-Журнал
- Журнал JAG
- Журнал 1816-1845 гг.
- KB Журнал
- KB Журнал
- KPA Journal
- Журнал L'Aut '
- L2 журнал
- LL журнал
- LLJournal
- M / C Журнал
- Журнал MAPS
- MC журнал
- NYJ Suppl.
- Журнал P&S
- RT Журнал
- Журнал SAE
- Журнал SAE
- Журнал SAPS
- SEJournal
- Журнал
- Журнал CPA
- Журнал GB
- Журнал КНА
- Юридический журнал
- Журнал SAE
- Журнал UMAP
- Журнал ВАК
- U of L Journal
- Журнал UMAP
- МЫ Журнал
Предположительно через одно из его небольших перенаправлений. Я предполагаю, что алгоритм выглядит примерно так
- A) Искать
The Astrophysical Journal
, получать перенаправления, такие какAPJ
/APJL
/APJS
(которые образуют набор A ) - B) Найдите нормализованные варианты и расширенные варианты набора A (которые образуют набор B , имея где-то
APJ+Journal
/APJL+Journal
/APJS+Journal
) - C) Поиск опечаток в множестве B (которые образуют набор C ), поиск
CAN Journal
и большинство других опечаток в одном или нескольких изAPJ+Journal
/APJL+Journal
/APJS+Journal
- D) Исключите статьи из набора C, которые не указывают на
The Astrophysical Journal
, но сохраняют красные ссылки (например, большинство из них)
Здесь под «нормализованным вариантом» я подразумеваю нормализацию Journal
→ J
, игнорирование серий / дополнений / букв / завершающего мусора и т. Д. Под «расширенным вариантом» я подразумеваю искусственное добавление «журнала / журнала», чтобы посмотреть, сможете ли вы найти совпадение.
Таким образом, для небольших имен или, возможно, в целом, вместо этого он должен делать
- A) Искать
The Astrophysical Journal
, получать перенаправления, такие какAPJ
/APJL
/APJS
(которые образуют набор A ) - B) Поиск нормализованных вариантов
и расширенных вариантовнабора A (которые образуют набор B ) - C) Найдите опечатки в множестве B (которые образуют множество C )
- D Выбросьте вещи, на которые не указывают
The Astrophysical Journal
, оставьте красные ссылки (которые образуют набор D ) - E) Поиск расширенных вариантов D (которые образуют множество E )
- F) Выбросьте вещи, на которые не указывают
The Astrophysical Journal
, оставьте красные ссылки (которые образуют набор F )
Headbomb { t · c · p · b } 09:15, 12 марта 2019 г. (UTC)
- Обработка фактически работает следующим образом:
- Для каждой обрабатываемой цели:
- Найдите все цитаты, относящиеся к этой цели
- Найдите все перенаправления на цель
- Для каждого из вышеперечисленных используйте их нормализацию, чтобы найти другие цитаты с таким же шаблоном. Матчи определяются как:
- Для строк из <3 символов требуется точное совпадение
- Для строк из 3-5 символов разрешите дельту в 1 символ.
- Для строк из 6-20 символов разрешите 1-2-символьные дельты.
- Для строк, состоящих из 21 и более символов, допускайте дельты от 1 до 3 символов.
- Избавьтесь от ложных срабатываний
- Выбросьте все, что решает, в статьи
- Для CRAP логика такая же, за исключением того, что на шаге 2 используются дополнительные параметры в строке конфигурации.
- В случае с «Астрофизическим журналом» он имеет перенаправление «Ap J», которое нормализуется к «apjournal». Это то, что вызывает вышеуказанные хиты. «J» заменяется на «журнал», чтобы такие случаи, как «Nature J.» и матч "Nature Journal". Это давно применяемая логика. Проблема в том, что подобные переадресации теперь используются. Я вижу три решения:
- Переключите нормализацию с "j" -> "journal" на "journal" -> "j". Это уменьшило бы размер струны, что уменьшило бы допуск. Если бы это было сделано, только «Журнал CAP» в приведенном выше списке был бы хитом. Однако я не думаю, что это хорошая идея, поскольку: а) он перестанет обнаруживать опечатки в слове «journal»; и б) он перестанет улавливать случаи, когда между термином и «журнал» нет пробела.
- Продолжайте нормализацию как есть, но если обе сравниваемые нормализации заканчиваются на «журнал», удалите «журнал» из обоих и сравните остатки. Используйте существующие правила дельты. В этом случае это приведет к сравнению "ap", и все вышеперечисленное будет отброшено. Он все равно должен улавливать случай a и b из приведенного выше варианта.
- Отметьте это как ложные срабатывания и покончите с этим. Это первый запуск с добавлением перенаправления, поэтому он должен стабилизироваться.
- Отменить включение редиректов.
- Дайте мне подумать и посмотреть, смогу ли я найти другие варианты. Если нет, я дам 2 укола. - JLaTondre ( разговор ) 01:22, 13 марта 2019 г. (UTC)
- Из них №2 кажется лучшим (как и «журнал»), или, по крайней мере, стоит попробовать посмотреть, как все пойдет. Не уверен, насколько хорошо будет работать мой предложенный выше алгоритм / насколько легко его будет реализовать. Может быть, лучше, а может быть и хуже.
- Но помечать их как ложные срабатывания вручную - это ... их просто так много . Headbomb { t · c · p · b } 01:48, 13 марта 2019 г. (UTC)
- Я реализовал №2 и повторно запустил TAR. Взгляните на это и посмотрите, что вы думаете. Если все хорошо, я обновлю и CRAP. Я еще не делал часть 5 (ниже), так как хотел увидеть изменения отдельно (на случай, если что-то пойдет не так). - JLaTondre ( разговор ) 01:46, 14 марта 2019 г. (UTC)
- Это привело к тому, что все стало намного более управляемым. Запустите все это (хотя не стесняйтесь держать № 5 отдельно). Headbomb { t · c · p · b } 02:30, 14 марта 2019 г. (UTC)
- ДЕРЬМО сделано. - JLaTondre ( разговор ) 17:33, 14 марта 2019 г. (UTC)
- Это привело к тому, что все стало намного более управляемым. Запустите все это (хотя не стесняйтесь держать № 5 отдельно). Headbomb { t · c · p · b } 02:30, 14 марта 2019 г. (UTC)
- Я реализовал №2 и повторно запустил TAR. Взгляните на это и посмотрите, что вы думаете. Если все хорошо, я обновлю и CRAP. Я еще не делал часть 5 (ниже), так как хотел увидеть изменения отдельно (на случай, если что-то пойдет не так). - JLaTondre ( разговор ) 01:46, 14 марта 2019 г. (UTC)
Новая версия, часть 3
Бот остановился на WP: JCW / Questionable10 , оставив WP: JCW / Questionable11 / WP: JCW / Questionable12 / WP: JCW / Questionable13 / WP: JCW / Questionable14 бесполезным. Они должны получить CSD, когда они больше не нужны. Headbomb { t · c · p · b } 09:21, 12 марта 2019 г. (UTC)
- Уже обработано. Бот сообщает мне, какие страницы больше не нужны, и я удаляю их после запуска. Обычно я буду рядом, когда он завершится. - JLaTondre ( разговор ) 20:39, 12 марта 2019 г. (UTC)
Новая версия, часть 4
В WP: JCW / CRAP несколько записей отсутствуют |source=
. Например , запись # 951 в WP: JCW / Questionable10 ( распознаванию в физике ) отсутствует |source=BLJ
из WP: CRAPWATCH / SETUP . Headbomb { t · c · p · b } 09:24, 12 марта 2019 г. (UTC)
- Исправлено, но будет ждать загрузки при следующем запуске. - JLaTondre ( разговор ) 01:25, 13 марта 2019 г. (UTC)
- По-прежнему есть случаи, когда не работают. Посмотрим на это подробнее. - JLaTondre ( разговор ) 17:34, 14 марта 2019 г. (UTC)
Возможно, это связано с такими записями, как
- Id Press [ OAMJMS индексируется в DOAJ ]
- ID Дизайн
которые задыхаются из-за трубы в примечании. Я исправил это , хотя не знаю, решит ли это эти проблемы. Headbomb { t · c · p · b } 07:44, 15 марта 2019 г. (UTC)
- Большинство случаев произошло из-за опечатки, которую я не заметил, потому что смотрел на нее. Я исправил это, но не обновил, так как задача содержимого выполнялась в течение последнего дня (мне также нужно поработать над тем, чтобы сделать это более эффективным). Вы правы, что трубы тоже могут создать проблему. Если их можно избежать, я бы предпочел не иметь с ними дела. - JLaTondre ( разговор ) 21:10, 15 марта 2019 г. (UTC)
- В целом следует избегать, хотя было бы полезно, если бы они были. Ни в коей мере не приоритетная задача. Headbomb { t · c · p · b } 03:16, 16 марта 2019 г. (UTC)
- Реализовано. Если вы заметите какие-либо случаи, в которых он не работает, сообщите мне. - JLaTondre ( разговор ) 19:13, 16 марта 2019 г. (UTC)
- На данный момент в нем нет ничего, что нужно, но я обновлю его позже, чтобы в некоторых случаях были более короткие заметки. Headbomb { t · c · p · b } 19:27, 16 марта 2019 г. (UTC)
- @ JLaTondre :, по- прежнему многие случаи не обрабатываются. См. WP: JCW / Questionable10 , записи 902–905 и 909. Их больше (например, 31 запись в WP: JCW / Questionable9 ). Headbomb { t · c · p · b } 06:14, 17 марта 2019 г. (UTC)
- Ух, запутались в футляре для трубы и забыли подтвердить изменение другими случаями. Должно быть исправлено. - JLaTondre ( разговор ) 16:26, 17 марта 2019 г. (UTC)
- @ JLaTondre :, по- прежнему многие случаи не обрабатываются. См. WP: JCW / Questionable10 , записи 902–905 и 909. Их больше (например, 31 запись в WP: JCW / Questionable9 ). Headbomb { t · c · p · b } 06:14, 17 марта 2019 г. (UTC)
- На данный момент в нем нет ничего, что нужно, но я обновлю его позже, чтобы в некоторых случаях были более короткие заметки. Headbomb { t · c · p · b } 19:27, 16 марта 2019 г. (UTC)
- Реализовано. Если вы заметите какие-либо случаи, в которых он не работает, сообщите мне. - JLaTondre ( разговор ) 19:13, 16 марта 2019 г. (UTC)
Новая версия, часть 5
В WP: JCW / CRAP (и в TAR, но в основном в CRAP) есть много ABCD
типов сокращений, которые соответствуют другим не связанным ABCD
типам сокращений.
Так что, если у вас есть что-то, состоящее из одного слова, написанного заглавными буквами, не ищите опечаток. Таким образом, что-то вроде IJSSMS
не совпадает, IJSSMM
а только IJSSMS
+ варианты с заглавными буквами + IJSSMS Journal
.
В качестве альтернативы, что может быть проще, может быть последний шаг, который удаляет все аббревиатуры, которые не соответствуют исходному вводу, сохраняя заглавные буквы.
Таким образом , если у вас есть APJ
в WP: CRAPWATCH / SETUP (или перенаправлением на то , что бы получить подхвачена WP: CRAPWATCH / Setup ), вы бы сохранить , APj
если он найден, но будет выбросить APT
.
Headbomb { t · c · p · b } 10:07, 12 марта 2019 г. (UTC)
- Выполнимо. Я внесу изменения в Часть 2 выше. - JLaTondre ( разговор ) 01:31, 13 марта 2019 г. (UTC)
- @ JLaTondre : эта часть реализована? Поскольку запись № 912 в WP: JCW / Questionable10 все еще соответствует, например, NELS и JELS. Headbomb { t · c · p · b } 06:09, 17 марта 2019 г. (UTC)
- Нет, я решил сделать это отдельно, чтобы проверить каждое изменение. Следующим моим шагом было попросить пример для проверки. Вы меня опередили. ;-) - JLaTondre ( разговор ) 16:27, 17 марта 2019 (UTC)
- С нетерпением жду, когда это будет реализовано. Я считаю, что это последняя «серьезная» проблема, с которой ложные срабатывания не вернутся до приемлемого уровня. Могу ошибаться в этом, но очень этого жду. Headbomb { t · c · p · b } 16:30, 17 марта 2019 г. (UTC)
- Реализована начальная версия. Создание вывода TAR и CRAP (локально). Наверное, не будет времени посмотреть и утвердить до завтра. - JLaTondre ( разговор ) 18:51, 17 марта 2019 г. (UTC)
- Прохладный. А пока я буду делать кучу дополнений к исключениям, поэтому, если ваши тесты покажут, что завтра ничего не взорвалось, сделайте новый прогон перед загрузкой. Headbomb { t · c · p · b } 19:00, 17 марта 2019 г. (UTC)
- Мне это нравится. Я перезагружаюсь и буду загружать. Между прочим, в той кучке добавлений, которые вы сделали, вы ввели число, которое вам не нужно было вводить, потому что они будут исключены из этого теста. - JLaTondre ( разговор ) 23:03, 18 марта 2019 г. (UTC)
- Ага. Отсюда # # Ненужные исключения приводятся ниже. Я старался избегать большинства, что не было бы подобрано по новым правилам, но я не стал изо всех сил делать тройную проверку, я включил только те, которые будут подобраны, тем более что я не видел новых правил в действии пока нет. Основная задача заключалась в том, чтобы избавиться от как можно большего количества ложных срабатываний перед новым запуском, по крайней мере, чтобы WP: JCW / CRAP не был таким массовым. Я оставил пару длинных записей в том виде, в каком они были, поскольку отсутствие иерархии опечаток затрудняло оценку, были ли они ложными срабатываниями или законными срабатываниями. Headbomb { t · c · p · b } 23:17, 18 марта 2019 г. (UTC)
- Мне это нравится. Я перезагружаюсь и буду загружать. Между прочим, в той кучке добавлений, которые вы сделали, вы ввели число, которое вам не нужно было вводить, потому что они будут исключены из этого теста. - JLaTondre ( разговор ) 23:03, 18 марта 2019 г. (UTC)
- Прохладный. А пока я буду делать кучу дополнений к исключениям, поэтому, если ваши тесты покажут, что завтра ничего не взорвалось, сделайте новый прогон перед загрузкой. Headbomb { t · c · p · b } 19:00, 17 марта 2019 г. (UTC)
- Реализована начальная версия. Создание вывода TAR и CRAP (локально). Наверное, не будет времени посмотреть и утвердить до завтра. - JLaTondre ( разговор ) 18:51, 17 марта 2019 г. (UTC)
- С нетерпением жду, когда это будет реализовано. Я считаю, что это последняя «серьезная» проблема, с которой ложные срабатывания не вернутся до приемлемого уровня. Могу ошибаться в этом, но очень этого жду. Headbomb { t · c · p · b } 16:30, 17 марта 2019 г. (UTC)
- Нет, я решил сделать это отдельно, чтобы проверить каждое изменение. Следующим моим шагом было попросить пример для проверки. Вы меня опередили. ;-) - JLaTondre ( разговор ) 16:27, 17 марта 2019 (UTC)
- @ JLaTondre : эта часть реализована? Поскольку запись № 912 в WP: JCW / Questionable10 все еще соответствует, например, NELS и JELS. Headbomb { t · c · p · b } 06:09, 17 марта 2019 г. (UTC)
Кажется, не работает. Взяв WP: JCW / Questionable9 , у вас есть записи 802, 818, 823, 829, 832, 833 ... и многие многие другие, все они соответствуют неточным аббревиатурам, состоящим только из заглавных букв. Headbomb { t · c · p · b } 07:19, 19 марта 2019 г. (UTC)
- Он игнорирует только все прописные слова одинаковой длины. Для «Международного журнала по методологии исследований в области физики и химии» конфигурация имеет «IJRMPC» (6 букв), но сообщаемый результат - «IJRAP» (5 букв). Я интерпретировал запрос таким образом, основываясь на том, что все ваши примеры имеют одинаковую длину, но при повторном чтении я вижу, что это не было заявлено. Я могу изменить это так, что если поисковый запрос написан полностью в верхнем регистре, он будет выдавать все результаты, все в верхнем регистре. - JLaTondre ( разговор ) 03:07, 20 марта 2019 г. (UTC)
- А, я вижу, моя первоначальная просьба была неоднозначной, да. Headbomb { t · c · p · b } 08:47, 20 марта 2019 г. (UTC)
- Изменено игнорирование прописных слов любой длины (когда цель также является прописным словом). Бегу сейчас. - JLaTondre ( разговор ) 00:47, 21 марта 2019 г. (UTC)
- А, я вижу, моя первоначальная просьба была неоднозначной, да. Headbomb { t · c · p · b } 08:47, 20 марта 2019 г. (UTC)
Новая версия, часть 6
Чтобы сократить количество ложных срабатываний, некоторые слова не должны учитываться в отношении «длины» строки.
- Бюллетени / Вестник / Бык. / Бык
- Журналы / Журнал
- Новости
- Информационный бюллетень / Newsl.
- Журнал / Mag.
- Ход работы / Процедура / Proc. / Proc
- Обзоры / Обзор / Ред. / Ред.
- В сети
- Транзакции / Транзакция / Транзакция / Транзакция
Итак, если у вас есть что-то вроде say CA News
, то для сравнения длина строки должна быть 2, а не 6. Headbomb { t · c · p · b } 17:44, 14 марта 2019 г. (UTC)
- Сделанный. Обработаю и отправлю. - JLaTondre ( разговор ) 16:02, 16 марта 2019 г. (UTC)
Новая версия, часть 7
- Использование сомнительной конфигурации по состоянию на 2019-03-15T08: 47: 19Z
- Использование ложноположительной конфигурации по состоянию на 2019-03-16T05: 07: 25Z
Их можно засунуть, {{JCW-bottom|e-id=887990773|q-id=887859138|r-time=2019-03-17}}
чтобы дать
- Дата
Использование |e-id=
и |q-id=
на страницах TAR / CRAP по мере необходимости. Headbomb { t · c · p · b } 06:54, 17 марта 2019 г. (UTC)
- Сделанный. - JLaTondre ( разговор ) 18:49, 17 марта 2019 г. (UTC)
Новая версия, часть 9
В [20] было установлено следующее исключение
- Опции (информационный бюллетень) ≠ Opticon 1826
однако это не соблюдается в WP: JCW / Questionable9 (запись № 804). Headbomb { t · c · p · b } 12:24, 19 марта 2019 г. (UTC)
Точно так же
- Публикации Medknow ≠ Can J Ophthalmol
- Публикации Medknow ≠ Can. J. Ophthalmol.
- Список академических журналов Medknow Publications ≠ Can J Ophthalmol
- Список академических журналов Medknow Publications ≠ Can. J. Ophthalmol.
но они все еще были включены в WP: JCW / Questionable1 (запись № 3) Headbomb { t · c · p · b } 13:13, 19 марта 2019 г. (UTC)
- Фиксированный. - JLaTondre ( разговор ) 02:48, 20 марта 2019 г. (UTC)
Вроде работает, хотя некоторые ассоциации утеряны, например,
- Биология (журнал) ≠ Биолог
используется для подавления «Биолога» из WP: JCW / Questionable1 , потому что « Биолог» соответствует журналу «Биология» , находящемуся под MDPI. На самом деле это не конец света, поскольку они могут быть повторно объявлены, но было бы полезно вернуть эти исключения (особенно, если реализована трехуровневая иерархия ), поскольку они уже были выполнены / работали раньше. Headbomb { t · c · p · b } 09:03, 20 марта 2019 г. (UTC)
- Чтобы было ясно, это не значит, что Biologue не удалось подобрать. Если бы существовал другой журнал MDPI (названный « Biologia »), то он соответствовал бы этому журналу и должен был быть представлен как есть. Просто, если соответствие биологии (журнал) является единственной причиной, по которой он включен в MDPI, его следует исключить. Headbomb { t · c · p · b } 09:10, 20 марта 2019 г. (UTC)
- Изменено игнорировать на обоих уровнях - основная сомнительная запись (поведение только что реализовано) или дополнительные цели (исходное поведение). Бегу сейчас. - JLaTondre ( разговор ) 00:50, 21 марта 2019 г. (UTC)
Новый формат исключения JCW
Я добавил кучу исключений (так что повторный запуск будет удивительным, даже если у вас еще нет нового дампа). Однако мы достигли предела расширения шаблона, поэтому в дополнение к «нормальному» формату
{{JCW-exclude | The Wire (журнал) | The Wave Magazine}}{{JCW-exclude | The Wire (журнал) | The WILD Magazine}}{{JCW-exclude | The Wire (журнал) | The Wild Magazine}}{{JCW-exclude | The Wire (журнал) | WHERE Magazine}}{{JCW-exclude | The Wire (журнал) | WHERE magazine}}{{JCW-exclude | The Wire (журнал) | WILD Magazine}}{{JCW-exclude | The Wire (журнал) | Wild Magazine}}
не могли бы вы поддержать
{{JCW-exclude | The Wire (журнал) | The Wave Magazine | The WILD Magazine | The Wild Magazine | WHERE Magazine | WHERE magazine | WILD Magazine | Wild Magazine}}
? Headbomb { t · c · p · b } 13:01, 21 марта 2019 г. (UTC)
- Новый формат еще не реализован, но как только он будет поддержан, мы, скорее всего, сможем заставить User: RonBot объединять и сортировать записи. Headbomb { t · c · p · b } 13:13, 21 марта 2019 г. (UTC)
- На самом деле отложите это. «Новый» формат резко увеличивает расширение пост-шаблона, поэтому он не упрощает загрузку / редактирование страниц. Может быть, позже, но пока в этом нет необходимости. Headbomb { t · c · p · b } 00:57, 23 марта 2019 г. (UTC)
Новый пробег
Спасибо за обновление. Я просто установил кучу исключений для расширенного Crapwatch, так что еще один запуск на данный момент был бы довольно продуктивным. Headbomb { t · c · p · b } 09:58, 26 февраля 2019 г. (UTC)
- Повторюсь сегодня. В новых ссылках появилось несколько новых шаблонов, для обработки которых я обновлю код. - JLaTondre ( разговор ) 11:34, 26 февраля 2019 г. (UTC)
- С WP происходят некоторые странные вещи : MCW / TAR , first Spin (журнал) ≠ Scan Magazine, похоже, не работает (запись № 18). Есть и другие примеры, когда самые последние исключения не сработали на страницах WP: MCW / TAR . Многие кажутся связанными с (журнальными) записями, но Pacific RailNews ≠ RiaNews также не работает над WP: MCW / Target2 . Во-вторых, количество похожих записей немного отличается. Например, Billboard (4365 в 1844 г.) поднимается до Billboard (4445 в 1880 г.). Headbomb { t · c · p · b } 06:54, 27 февраля 2019 г. (UTC)
- Что касается исключений, я считаю, что проблема заключалась в обработке до того, как эти записи были добавлены на страницу конфигурации. Хотя временная метка сохранения находится после того, как они были добавлены, запуск на самом деле произошел до этого и был загружен позже (обычно этого не происходит, но иногда обработка прерывается). Я повторно запустил целевую обработку, и она исключает их. Я обновлю как целевой, так и сомнительный результат, чтобы включить временные метки страницы конфигурации для дальнейшего использования. В случае с Billboard разница сравнивает результаты дампа 02/01 с результатами дампа 02/20, поэтому они должны отличаться. - JLaTondre ( разговор ) 02:34, 28 февраля 2019 (UTC)
- С WP происходят некоторые странные вещи : MCW / TAR , first Spin (журнал) ≠ Scan Magazine, похоже, не работает (запись № 18). Есть и другие примеры, когда самые последние исключения не сработали на страницах WP: MCW / TAR . Многие кажутся связанными с (журнальными) записями, но Pacific RailNews ≠ RiaNews также не работает над WP: MCW / Target2 . Во-вторых, количество похожих записей немного отличается. Например, Billboard (4365 в 1844 г.) поднимается до Billboard (4445 в 1880 г.). Headbomb { t · c · p · b } 06:54, 27 февраля 2019 г. (UTC)
Давно не было новой свалки. Даже если у вас нет времени на внедрение последних настроек, новый запуск был бы полезен. Headbomb { t · c · p · b } 09:52, 8 марта 2019 г. (UTC)
- Старая версия работает. Я надеюсь, что в эти выходные мы завершим выпуск новой версии. - JLaTondre ( разговор ), 03:30, 9 марта 2019 г. (UTC)
- Бот, кажется, подавился Crapwatch. Хотя все остальное сделал нормально. Headbomb { t · c · p · b } 12:33, 9 марта 2019 г. (UTC)
- Сомнительные страницы сохранены. - JLaTondre ( разговор ) 13:43, 9 марта 2019 г. (UTC)
- См. [21] , хотя со временем он будет заменен новым форматом, приведенным ниже. Я исправил страницы, поэтому не нужно повторно запускать. Headbomb { t · c · p · b } 14:00, 9 марта 2019 г. (UTC)
- Я установил кучу новых исключений, но изменения будут относительно минимальными (в основном затрагивают TAR25 - TAR30). Здесь мы приближаемся к асимптотически стабильному множеству (по крайней мере, с текущими алгоритмами). Было бы неплохо выполнить новый запуск, если вы хотите запустить его на ночь, пока спите, но это, конечно, не критично (и можно подождать, пока не будет реализован новый формат). Headbomb { t · c · p · b } 16:16, 11 марта 2019 г. (UTC)
- Загрузка текущей версии предшествует новым исключениям, но вам потребуется больше (см. Обсуждение пользователей: JL-Bot # Citation New Version Live ). - JLaTondre ( разговор ) 21:39, 11 марта 2019 г. (UTC)
- Я установил кучу новых исключений, но изменения будут относительно минимальными (в основном затрагивают TAR25 - TAR30). Здесь мы приближаемся к асимптотически стабильному множеству (по крайней мере, с текущими алгоритмами). Было бы неплохо выполнить новый запуск, если вы хотите запустить его на ночь, пока спите, но это, конечно, не критично (и можно подождать, пока не будет реализован новый формат). Headbomb { t · c · p · b } 16:16, 11 марта 2019 г. (UTC)
- См. [21] , хотя со временем он будет заменен новым форматом, приведенным ниже. Я исправил страницы, поэтому не нужно повторно запускать. Headbomb { t · c · p · b } 14:00, 9 марта 2019 г. (UTC)
- Сомнительные страницы сохранены. - JLaTondre ( разговор ) 13:43, 9 марта 2019 г. (UTC)
- Бот, кажется, подавился Crapwatch. Хотя все остальное сделал нормально. Headbomb { t · c · p · b } 12:33, 9 марта 2019 г. (UTC)
Когда ждать нового пробега? Я надеялся проверить последнюю логику с новым дампом и получить окончательный пропуск перед публикацией этого указателя до конца месяца. Headbomb { t · c · p · b } 09:12, 24 марта 2019 г. (UTC)
- Экономия сейчас. - JLaTondre ( разговор ) 00:54, 26 марта 2019 г. (UTC)
- @ JLaTondre : Я добавил кучу исключений Crapwatch. Если вы сейчас запустите ее повторно, я могу отправить статью «Указатель» для публикации. Headbomb { t · c · p · b } 15:13, 26 марта 2019 г. (UTC)
- Бег. На это уйдет пара часов. - JLaTondre ( разговор ) 21:16, 26 марта 2019 г. (UTC)
- Хммм, кажется, что при одинаковом количестве цитирований порядок случайный. Я добавлю дополнительный уровень сортировки (количество статей), чтобы избежать этого типа флип-флопа . - JLaTondre ( разговор ) 01:09, 27 марта 2019 г. (UTC)
- Сделанный. С этого момента должно быть последовательным. - JLaTondre ( разговор ) 01:26, 27 марта 2019 г. (UTC)
- Холодные бобы. Все выглядит хорошо, поэтому я отправил свою статью в Signpost. Я обновил некоторые заметки и буду полировать еще кое-что, но ничего серьезного, что потребовало бы повторных запусков. Не стесняйтесь сделать один 30-го числа, так как Указатель будет опубликован 31-го числа, надеюсь, с моей статьей в нем. Headbomb { t · c · p · b } 01:33, 27 марта 2019 г. (UTC)
- Фактически, теперь, когда Список академических журналов Dove Medical Press был расширен, есть возможность провести еще один выпуск до «финального» журнала 30-го числа. Headbomb { t · c · p · b } 22:51, 27 марта 2019 г. (UTC)
- Кроме того, с кучей дополнений из обновлений списков Билла стоит попробовать. Headbomb { t · c · p · b } 15:26, 29 марта 2019 г. (UTC)
- Фактически, теперь, когда Список академических журналов Dove Medical Press был расширен, есть возможность провести еще один выпуск до «финального» журнала 30-го числа. Headbomb { t · c · p · b } 22:51, 27 марта 2019 г. (UTC)
- Холодные бобы. Все выглядит хорошо, поэтому я отправил свою статью в Signpost. Я обновил некоторые заметки и буду полировать еще кое-что, но ничего серьезного, что потребовало бы повторных запусков. Не стесняйтесь сделать один 30-го числа, так как Указатель будет опубликован 31-го числа, надеюсь, с моей статьей в нем. Headbomb { t · c · p · b } 01:33, 27 марта 2019 г. (UTC)
- Сделанный. С этого момента должно быть последовательным. - JLaTondre ( разговор ) 01:26, 27 марта 2019 г. (UTC)
- Хммм, кажется, что при одинаковом количестве цитирований порядок случайный. Я добавлю дополнительный уровень сортировки (количество статей), чтобы избежать этого типа флип-флопа . - JLaTondre ( разговор ) 01:09, 27 марта 2019 г. (UTC)
- Бег. На это уйдет пара часов. - JLaTondre ( разговор ) 21:16, 26 марта 2019 г. (UTC)
- @ JLaTondre : Я добавил кучу исключений Crapwatch. Если вы сейчас запустите ее повторно, я могу отправить статью «Указатель» для публикации. Headbomb { t · c · p · b } 15:13, 26 марта 2019 г. (UTC)
Я только что завершил последние исключения и примечания, чтобы иметь дело с журналами Dove и последним расширением списка. Один последний проход перед публикацией указателя позаботится обо всех мелочах. К тому времени, когда появится новый дамп, трафик на странице должен утихнуть, и если у нас будут ложные срабатывания, волноваться не будет. Headbomb { t · c · p · b } 04:37, 31 марта 2019 г. (UTC)
- Бег. Результаты появятся через пару часов. - JLaTondre ( разговор ) 17:45, 31 марта 2019 г. (UTC)
Кусок указателя
Буду признателен за некоторую поддержку здесь (относительно публикации User: Headbomb / Crapwatch ), если вы считаете, что это хорошая инициатива. Headbomb { t · c · p · b } 12:10, 28 марта 2019 г. (UTC)
- Похоже, он движется вперед. - JLaTondre ( разговор ) 17:48, 31 марта 2019 г. (UTC)
Нужна помощь
Я пытался настроить JL-Bot, но не уверен, что это правильно. Есть две страницы:
- Википедия: Движение за гражданские права WikiProject / Открытые задачи
- Википедия: Движение за гражданские права WikiProject / Качественные статьи
Я создал обе страницы 22 марта 2019 года, но ничего не появилось. Я думал, что бот запускается раз в неделю. Пожалуйста, поправьте меня, если я ошибаюсь. Митчамч ( разговорное ) 04:50, 1 апреля 2019 (UTC)
- Номинально раз в неделю. В эти выходные он не прошел из-за конфликта. Я сравнил его с этими двумя страницами. Теперь я заставлю его нормально работать. - JLaTondre ( разговор ) 22:38, 1 апреля 2019 г. (UTC)
- Это выглядит хорошо. Спасибо. Митчамч ( разговорное ) 23:03, 1 апреля 2019 (UTC)
Дамп наконец
Потребовалось время, но наконец-то появилась годная апрельская свалка. Headbomb { t · c · p · b } 09:06, 10 апреля 2019 г. (UTC)