Википедия:Категоризация
Эта страница планируется к включению в справочную систему Википедии в качестве правила. |
Данный текст обсуждался, и по отдельным его положениям сформирован консенсус.
|
Вкратце: категоризация должна помогать читателям ориентироваться в Википедии. При этом количество категорий для отдельных статей должно быть разумным и оправданным. Названия категорий должны быть нейтральными и узнаваемыми. |
Категоризация — структурирование схожих страниц по темам, формирование обобщающих, классифицирующих категорий, реализуемое в целях навигации и установления соотношений между страницами. Настоящие правила устанавливают требования и порядок установки категорий на страницы, а также требования, предъявляемые к самим страницам категорий.
Основные определения
[[Категория:<Имя>]]
, где <Имя>
— название категории (имя страницы в пространстве имён «Категория»), и представляет собой упорядоченный список страниц, включённых в данную категорию.
Страница — страница из любого пространства имён, в том числе и из пространства категорий.
Статья — страница из основного пространства имён.
Включение страницы в категорию — добавление тег-ссылки на эту категорию ([[Категория:<Имя>]]
) в код включаемой страницы.
Подкатегория (дочерняя категория) — категория, включённая в данную категорию.
Надкатегория (родительская категория) — категория, в которую включена категория.Категория-потомок категории — категория, цепочку родительских категорий которой можно проследить от данной категории.
Категория-предок категории — категория, цепочку дочерних категорий которой можно проследить до данной категории.
Опосредованное включение в категорию — включение страницы в одну из категорий-потомков данной категории.
Тема категории — выражение, соответствующее предметной области категории. Часто тема соответствует названию категории.
Критерий категории — сформулированное явно или подразумеваемое условие включения той или иной страницы в категорию. Критерий устанавливает отношение (семантическую связь) между темой категории и включаемыми в неё страницами в форме высказывания. При этом включаемый элемент является грамматическим субъектом высказывания об отношении, а тема категории — составной частью предиката высказывания об отношении.
Страница категории
На странице категории указываются:
- Хотя бы одна категория старшего уровня (обязательное требование);
- Критерий включения элементов в категорию, в особенности в тех случаях, когда этот критерий не следует однозначным образом из названия категории и возможны разногласия о включении в категорию той или иной страницы;
- Характеристика принципа включения данной категории в родительские, особенно в случаях неочевидности такого включения. Указывается на самой странице категории или в комментариях к тегам родительских категорий;
- Навигационные шаблоны со ссылками на аналогичные категории в братских проектах фонда Викимедиа;
- Ссылки на близкие категории, не являющиеся предками или потомками данной;
- Ссылка на основную статью, соответствующую тематике категории (например, ссылка на страницу «Москва» в категории «Категория:Москва») с помощью шаблона {{catmain}});
- Шаблоны-индексы, упрощающие навигацию по категории;
- Предупреждающие и информационные шаблоны о статусе категории.
Основные принципы категоризации статей
Включение статьи в категорию
Всякая статья или категория (кроме корневой) должна быть включена хотя бы в одну категорию. При этом статья по возможности должна быть включена (напрямую или опосредованно) во все категории, под критерий которых она подпадает, и ни в одну из тех, под критерий которых она не подпадает. Если статья подходит по смыслу для категории «А» и её подкатегории «Б», то её, как правило, следует включать только в «Б». Исключением может быть тот случай, когда статья значима и для всей категории «А» (как правило, это обзорные статьи, например, «История математических обозначений»).
Критерии категоризации статей
Существенность признака означает наличие зафиксированного в авторитетных источниках способа классификации категоризуемых объектов, соответствующего критерию категории. Уникальность подразумевает недопустимость создания множественных категорий с идентичными или очень близкими критериями включения. Проверяемость требует возможности проверить выполнение критерия категории для каждой из статей на основании авторитетных источников. Нейтральная точка зрения требует соблюдения нейтральности в формулировке критерия. Недопустимость оригинальных исследований означает запрет на самостоятельные и неотражённые в авторитетных источниках выводы относительно соответствия элементов категории её критерию, а также формулировать сами критерии оригинальным образом. Потенциал наполнения ограничивает создание категорий, число элементов которой никогда не превысит весьма небольшого значения.
Обычно в качестве критерия выбираются следующие отношения (включаемая страница — категория):- Подмножество и множество, вид и род (зайцы — это млекопитающие, фильмы — это произведения).
- Часть и целое (орган — часть организма, улица — часть города).
- Объект и рубрика, соответствующая дисциплине или сфере деятельности, имеющей дело с данным объектом (фильмы относятся к сфере кинематографа, свет изучается оптикой).
- Произвольная (ассоциативная) связь категоризуемого объекта с объектом, соответствующим теме категории. Разновидностью такой связи являются категории-эпонимы (Тригорское, Наталья Гончарова, Евгений Онегин связаны с Пушкиным). Вопрос о допустимости подобного рода связей является дискуссионным.
- Значимая связь иного определённого рода. При этом вопрос о значимости того или иного вида связи остаётся дискуссионным и не имеет в настоящий момент однозначного решения.
Граф категорий
Именование категорий
Существует также ряд частных соглашений об именовании категорий:
- Категории, в названии которых встречаются славянские топонимы на -о в косвенных падежах, следует именовать со склонением данных топонимов[1].
- При именовании категорий, связанных с языком и литературой, приняты следующие условности[2]:
- В число писателей включают также поэтов, драматургов и т. п. (но они могут быть выделены и в отдельные подкатегории).
- Прилагательным на -ские обозначают язык, изредка — национально-культурную основу; когда такое прилагательное образовать нельзя, используют предлог «на», например, «Категория:Писатели на идише».
- Названием страны в родительном падеже обозначают государственную принадлежность.
Существование дубликатов категорий недопустимо, даже с широко распространёнными некорректными или альтернативными названиями. Такие категории удаляются и защищаются от воссоздания по ошибке[3].
Использование ключа сортировки
Для персоналий обычно этим ключевым словом является фамилия — подлинная или вымышленная, — или, в некоторых случаях, аналогичный или подобный ей элемент. С очень высокой вероятностью писателя Марка Твена будут искать на букву «Т», хотя, строго говоря, «Твен» — не фамилия. Таким образом в этом случае следует использовать ключ сортировки {{DEFAULTSORT:Твен, Марк}}
. То же относится к имени Саддам Хусейн («Хусейн» — не фамилия, а патроним — нечто вроде русского отчества): вполне вероятно, что его будут искать в алфавитном списке на букву «Х», а не на букву «С», — а значит, логичным будет использование ключа сортировки {{DEFAULTSORT:Хусейн, Саддам}}
.
[[Категория:Театры Москвы|Музыкальный театр им. К. С. Станиславского и В. И. Немировича-Данченко]]
.Использование ключа сортировки для разделения статей внутри категорий
*
», «<пробел>
», «!
» и другие, например, следующим образом: [[Категория:Имя категории|*]]
. В случае, если статья является ключевой для категории и наоборот, но по каким-то соображениям включение статьи в категорию не производится, для взаимных ссылок можно пользоваться шаблонами {{maincat}} и {{addoncat}}.Пересечение категорий
Возможна ситуация, когда две категории пересекаются, имеют общую область. В таких случаях бывает удобно создать категорию, объединяющую область их наложения. Например, «Категория:Генетика» и «Категория:Медицина» могут иметь много общих статей, но нельзя помещать ни одну из них в другую. Вместо этого логично создать «Категория:Медицинская генетика», сделав её подкатегорией обеих исходных категорий, и все статьи из пересекающихся областей помещать в эту категорию-пересечение.
При создании категории-пересечения должны выполняться три существенных условия: транзитивность, нетривиальность пересечения и общепринятость такой пересекающей классификации. Транзитивность в данном случае означает, что все элементы категории-пересечения должны соответствовать критериям её родительских категорий. Нетривиальность означает осмысленность и неслучайность пересечения, наличие у пересечения существенной для классифицируемых объектов общности непосредственно по пересекающемуся критерию. Общепринятость подразумевает, что такое пересечение не является искусственным или оригинальным, а основывается на авторитетных источниках.
Если для какой-либо статьи или группы статей не удается создать пересечения, удовлетворяющего указанным требованиям, то следует воздержаться от создания пересечения, а помещать такие статьи в несколько категорий, классифицирующих статьи по каждому из признаков отдельно. Например, не следует создавать категории «Психоактивные вещества, являющиеся лекарственными средствами» или «Музыканты России, родившиеся в 1968 году». В таких случаях для целей поиска статей по пересечению произвольных критериев можно воспользоваться инструментом «CatScan».
Транзитивность
Многие инструменты и боты в Википедии (в частности использующие «CatScan») теряют свою функциональность при нарушениях транзитивности. В связи с этим настоятельно не рекомендуется нарушать транзитивность в группах категорий, относящихся к какой-либо тематической или предметной области, зачастую соответствующей какому-либо из тематических вики-проектов.
Транзитивность обычно нарушается в двух случаях: при несоблюдении критерия включения в категорию, либо при несовместимости (нетранзитивности) самих критериев. Первый случай следует рассматривать как ошибку, требующую исправления. Второй требует уточнения самих критериев и детального рассмотрения конкретного случая.
Наиболее желательным является построение такого дерева категорий, которое бы обеспечивало соблюдение транзитивности на каждой связи. Ниже приведена таблица, отражающая типы связей, которые сохраняют транзитивность. В случаях, когда транзитивность не обеспечивается, возможны два решения: либо перестроение дерева таким образом, чтобы транзитивность соблюдалась, либо, в случаях, когда навигация между двумя категориями желательна, но транзитивным образом её реализовать невозможно, возможным решением может являться проставление ссылки на близкие по смыслу категории на самих страницах категории при помощи шаблонов {{addoncat}}, функции парсера {{#categorytree:}} или аналогичными способами.
Во всех случаях следует избегать включения категории, связанной с каким-либо объектом посредством отношения, нетранзитивного к вышестоящим, в категории, характеризующие только данный объект, но не все объекты, связанные с ним. Вместо этого следует включать в такую характеризующую категорию только саму статью об исходном объекте. Например, категорию «Москва» не следует помещать в категорию «Города». В последнюю следует включить лишь саму статью «Москва». В этом случае объекты, связанные с Москвой (улицы, достопримечательности и т. п.), не попадут в категорию «Города», а статья о Москве останется в категории городов.
Транзитивность отдельных типов отношений
В таблице представлены основные типы семантических отношений, задаваемых используемыми в настоящий момент критериями категоризации, с указанием совместимости таких отношений с точки зрения транзитивности.
Критерий дочерней категории | Критерий родительской категории | ||||
---|---|---|---|---|---|
Вид — род | Часть — целое | Объект — рубрика | Объект — ассоциированный объект | Иное | |
Вид — род | Да | Да | Да | Да | Да |
Часть — целое | Нет | Да | Частично | Частично | Неизвестно |
Объект — рубрика | Нет | Частично | Нет | Нет | Неизвестно |
Объект — ассоциированный объект | Нет | Нет | Нет | Нет | Неизвестно |
Иное | Неизвестно | Неизвестно | Неизвестно | Неизвестно | Неизвестно |
- Да — транзитивность обеспечивается;
- Нет — транзитивность не обеспечивается, возможно, за отдельными исключениями;
- Частично — транзитивность может быть достигнута и часто достигается, однако строгое соблюдение транзитивности во всех случаях не гарантируется;
- Неизвестно — ситуация с транзитивностью не установлена.
Дополнительные пояснения к таблице даны на отдельной странице.
Чрезмерная категоризация и лишние категории
Категоризация — механизм навигации и установления отношений между статьями. При чрезмерном использовании категорий в статье действительно важные и значимые связи будут теряться в информационном шуме от гораздо менее значимых категорий. Настоящий раздел устанавливает явные ограничения на некоторые типы категорий.
Следует воздерживаться от создания (и удалять):
- Категории, название которых не является научным, общепринятым или самым распространённым — см. «Википедия:Недопустимость оригинальных исследований»:
- «Околофутбол», «Суперорганизмы».
- Категории, нарушающие нейтральную точку зрения (при этом ненейтральное название следует заменить нейтральным, ненейтральные же принципы включения совершенно недопустимы):
- «Железный занавес», «Жертвы КГБ».
- Размытые категории, не имеющие чётко определённых критериев включения, если такая классификация не общепринята:
- «Объекты коллекционирования», «Научное сообщество», «Разные средства», однако
✔ «Языки».
- «Объекты коллекционирования», «Научное сообщество», «Разные средства», однако
- Категории, включающие статьи, не образующие общности (не представляющие единства как собрания), если такая категоризация не является навигационно оправданной:
- «Актёры фильмов Тима Бёртона», «Внебрачные дети», однако
✔ «Фильмы-сиквелы», «Персоналии по причине смерти».
- «Актёры фильмов Тима Бёртона», «Внебрачные дети», однако
- Категории, группирующие статьи по вероятностным признакам:
- Категории, группирующие исполнителей по совершаемым ими действиям, за исключением нормальных цеховых классификаций:
- Категории, группирующие людей по мнениям, привычкам, религиозной, идеологической принадлежности, даже если по этому поводу могут быть найдены авторитетные источники (это не относится к различного рода активистам или деятелям, принадлежащим к той или иной научной или философской школе):
- «Католики», «Вегетарианцы», «Атеисты», однако
✔ «Эволюционисты».
- «Католики», «Вегетарианцы», «Атеисты», однако
- Категории, формирующиеся по субъективным, оценочным признакам:
- «Знаменитые вятчане», «Примечательные жилые здания», «Трэшевое кино», однако
✔ «Праведные халифы».
- «Знаменитые вятчане», «Примечательные жилые здания», «Трэшевое кино», однако
- Категории, формирующиеся по произвольно выбранным критериям, не являющимся общепринятыми для данной области:
- «Двухбуквенные топонимы», «Умершие в день рождения», «Группы с одним постоянным музыкантом», «Страны с ВВП больше $ 30 млн в год».
- Категории, формирующиеся искусственным географическим разделением, кроме системно применяемых, необходимых для разрежения родительских категорий:
- Категории, формирующиеся за счёт признанного незначимым или не соответствующим НТЗ разделения по сексуальной ориентации, этническому, расовому или религиозному критериям. Однако возможна категоризация по государственной принадлежности, а для литераторов — по языку произведений[4]:
- Категории-«кентавры» с искусственно суженными критериями, тривиальным пересечением[5]:
- Маленькие категории без потенциала для роста вне однотипной категоризации:
- Категории с заведомо большим дублированием, чрезмерно усложняющие категоризацию:
- Категории, группирующие статьи по части названия, имени или фамилии или другим лингвистическим признакам, когда такая группировка не связана с содержанием статей:
- Категории, группирующие персоналии по полученным наградам; для таких случаев лучше использовать списки:
- Категории, группирующие статьи по получению наград и грамот или включению в списки:
- «Десять самых красивых миллионеров по версии журнала „Форбс“», однако
✔ «500 величайших песен по версии журнала „Rolling Stone“».
- «Десять самых красивых миллионеров по версии журнала „Форбс“», однако
- Категории, группирующие общее по частному (например, места по событиям), объекты по свойствам или признакам, когда такая группировка не производится широко и систематически:
- Категории с тривиальным признаком категоризации:
- Категории-эпонимы для персоналий, содержащие в неструктурированном виде всё, связанное с этими персоналиями.
- Категории вида «Люди, связанные с…»:
- Категории, группирующие объекты по незначимому для объекта признаку:
- Категории-эпонимы, состоящие только из статей, вики-ссылки на которые доступны из основной обзорной статьи по теме (за исключением ссылок из навигационных шаблонов), при условии невысокой вероятности появления новых элементов категории, не удовлетворяющих указанному условию.
Категоризация персоналий по географической принадлежности
- По итогам опроса.
- В случае с переименованными регионами (Ленинград, Калининская область, Тифлис) все персоналии категоризируются по последнему названию региона: Санкт-Петербург, Тверская область, Тбилиси.
- Категории по упразднённым регионам (Московская губерния, Пермская область) должны самостоятельно существовать.
- Категории по отдельному населённому пункту создаются при условии, что уже существуют три гарантированных статьи, которые туда будут включены.
- Категории типа «Живущие в городе» или «Жившие в городе» недопустимы.
Специальная организация категорий
В данном разделе описываются решения категоризации, связанные с конкретными категориями.
Основное пространство имён
Категории списков
Перенаправления
Категоризация перенаправлений в Википедии не принята, однако допустима для синонимов, получивших широкое распространение (например, в категории «Лекарственные средства по алфавиту» такая категоризация позволяет свободно ориентироваться среди синонимов лекарств). В категории «Фразеологизмы» и её подкатегориях могут быть перенаправления, если название статьи не совпадает с описываемым фразеологизмом.
Заглавная страница
Заглавная страница может существовать без включения в категории.
Служебные категории
Неосновные пространства имён
Изображения
Изображения не стоит включать в общие категории, а категоризировать их нужно в рамках категории «Изображения по темам». Название категории должно начинаться с префикса «Изображения:». Категоризировать изображения по лицензиям нужно при помощи соответствующих шаблонов — см. «Википедия:Шаблоны/Лицензии изображений».
Не забывайте, что Википедия — не файловый архив; лучшим вариантом будет перенесение изображений со свободной лицензией на Викисклад и категоризация их там.
Шаблоны
Префикс «Википедия:» рекомендуется не указывать и использовать либо просто <noinclude>[[Категория:Шаблоны:…]]</noinclude>
либо указатель типа <noinclude>[[Категория:Навигационные шаблоны:…]]</noinclude>
или <noinclude>[[Категория:Шаблоны-карточки:…]]</noinclude>
.
Википедия
Страницы из пространства «Википедия», а также справки и порталы должны категоризироваться в рамках категории «Википедия:Служебные»[6].
Участники
Категоризация участников может производиться только по признакам, признанным однозначно полезными.
Скрытые категории
Механизм скрытия категорий предназначен в основном для того, чтобы читатель на страницах для читателей (таких, как статьи и порталы) не увидел категории, нужные только для работы в Википедии. Обычно скрытые категории используются для отражения текущего статуса статьи, а не предмета статьи, и зачастую являются временными, например, «Категория:Википедия:Статьи с утверждениями без источников». В спорных случаях возможно сокрытие категории в качестве временного решения вместо её удаления.
Категория автоматически становится скрытой при добавлении магического слова __HIDDENCAT__ на страницу категории. Рекомендуется добавлять это слово перед списком «верхних» категорий.
Не всякую категорию не для читателей нужно делать скрытой. Нет необходимости делать скрытой категорию, которую со страниц для читателей увидеть в любом случае невозможно. Например, внутренняя «Категория:Википедия:Патрулирование» скрытой не является, поскольку предназначена для включения в неё только внутренних страниц.
Захламление категорий
Ссылки с тестовых пользовательских и тому подобных страниц захламляют категории. Поэтому рекомендованы следующие ограничения:
- При разработке статьи в личном пространстве категории должны быть отключены: двоеточием (например,
[[:Категория:Хомяки]]
), комментарием (например,<!-- [[Категория:Хомяки]] -->
), при помощи шаблона {{Будет в}} или иным аналогичным способом. - При включении шаблона, присутствующего в категории, не пользуйтесь его возможностями по установке категорий. Некоторые шаблоны позволяют выключить установку внешних категорий передачей параметра
|nocat=1
. Можно добавить данную функцию в шаблон заключением категорий в конструкцию{{#if:{{{nocat|}}}||[[Категория:Название категории]]}}
вместо[[Категория:Название категории]]
, или применяйте подстановку «subst:»[7] (применение подстановок в статьях не рекомендуется), а затем удаляйте тег категории. - При разработке статей в Инкубаторе следуйте правилам Инкубатора — отключайте категории двоеточием (
[[:Категория:Хомяки]]
).
Процедурные вопросы
Область применения правил
Обсуждение категорий
== 8 февраля 2023 == === Название категорий ===
Желательно, чтобы на всех обсуждаемых категориях стоял шаблон {{Обсуждаемая категория}} или более точные:
…с указанием даты постановки на обсуждение ({{Обсуждаемая категория|8 февраля 2023}}
) и были оставлены сообщения об обсуждении на страницах соответствующих тематике порталов или проектов.
Итоги подводят сами участники по достижении консенсуса, нормальным сроком обсуждения считается неделя, но он может быть превышен, если дисскусия не утихает или если высказалось недостаточное количество участников.
Пустые категории могут быть быстро удалены администраторами без обсуждения. Такие категории следует помечать шаблоном {{уд-пусткат}} или {{db-catempty}}.Примечания
- ↑ См.: Википедия:Обсуждение категорий/Январь 2012 § объединить Категория:Родившиеся в Одинцове и Категория:Родившиеся в Одинцово в последнюю.
- ↑ См. Википедия:Обсуждение категорий/Ноябрь 2011 § Категория:ххх писатели, Категория:ххх поэты, Категория:ххх литература, Категория:ххх драматурги, и др. в Википедия:Критерии категоризации персоналий по государственной принадлежности § Названия категорий писателей.
- ↑ См. Википедия:Форум/Архив/Предложения/2017/11 § Упразднить механизм Категория:Википедия:Категории-дубликаты.
- ↑ Более подробно см. «Википедия:Критерии категоризации персоналий по государственной принадлежности».
- ↑ Включение статьи, входящей и в категорию «А», и в категорию «Б», в категорию «„А“ и „Б“», когда для другой статьи может быть выбрано объединение «„А“ и „Д“».
- ↑ Название данной категории может быть изменено по консенсусу.
- ↑
{{subst:Имя шаблона}}.
См. также
- Википедия:Критерии категоризации персоналий по государственной принадлежности (также опрос)
- Википедия:Категоризация рек России
- Проект:Систематизация категорий
- Памятка по систематизации категорий
- Википедия:Форум/Архив/Предложения/2017/04#Отделение дерева категорий-эпонимов от общего дерева категорий
- Категория:Википедия:Эссе:Категоризация
- Help:Category (англ.)
- Categorization (англ.)
- Portal:Contents (англ.)
- tools - Category Pathfinder поиск пути от категории до страницы через другие категории, vCat CategoryTree inverse
Служебные страницы
- Все категории
- Дерево категорий
- Самые используемые категории
- Неиспользуемые категории
- Некатегоризованные категории
- Страницы, включённые в большое количество категорий
- Некатегоризованные страницы
- Требуемые категории
Списки против категорий
- Wikipedia:Merge some redundant lists to categories (англ.)
- Category:Demo (англ.) и страница обсуждения — Category talk:Demo (англ.)