Number
: number
Number
is an inflectional feature of nouns and
other parts of speech (adjectives,
verbs) that mark agreement with nouns.
Sing
: singular number
A singular noun denotes one person, animal or thing.
Examples
- стырый мужчина пришёл “an old man came”
- молодая женщина пришла “a young woman came”
- маленький цыплёнок пришёл “a small chicken came”
Plur
: plural number
A plural noun denotes several persons, animals or things.
Examples
- старый мужчины пришли “old men came”
- молодые женщины пришли “young women came”
- маленькие цыплята пришли “small chickens came”
Ptan
: plurale tantum
Some nouns appear only in the plural form even though they denote one
thing (semantic singular); some tagsets mark this distinction.
Grammatically they behave like plurals, so Plur
is obviously the
back-off value here; however, the
non-existence of singular form sometimes means that the gender is
unknown. In Czech, special type of numerals is used when counting
nouns that are plurale tantum (NumType=Sets
).
Examples
- ножницы, штаны “scissors, pants”
Coll
: collective / mass / singulare tantum
Collective or mass or singulare tantum is a special case of singular. It applies to words that use grammatical singular to describe sets of objects, i.e. semantic plural. Although in theory they might be able to form plural, in practice it would be rarely semantically plausible. Sometimes, the plural form exists and means “several sorts of” or “several packages of”.
Examples
- человечество “mankind”
Diffs
Russian National Corpus
The RNC tagset does not distinguish Ptan
from Plur
and Coll
from Sing
,
therefore this distinction is not being made in the converted data.
Treebank Statistics (UD_Russian)
This feature is universal.
It occurs with 2 different values: Plur
, Sing
.
58294 tokens (59%) have a non-empty value of Number
.
28847 types (96%) occur at least once with a non-empty value of Number
.
1 lemmas (0) occur at least once with a non-empty value of Number
.
The feature is used with 11 part-of-speech tags: ru-pos/NOUN (26649; 27% instances), ru-pos/ADJ (12480; 13% instances), ru-pos/VERB (8140; 8% instances), ru-pos/PROPN (7603; 8% instances), ru-pos/DET (1667; 2% instances), ru-pos/PRON (1424; 1% instances), ru-pos/NUM (317; 0% instances), ru-pos/X (10; 0% instances), ru-pos/ADV (2; 0% instances), ru-pos/SCONJ (1; 0% instances), ru-pos/SYM (1; 0% instances).
NOUN
26649 ru-pos/NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NOUN
and Number
co-occurred: Animacy=Inan (22873; 86%).
NOUN
tokens may have the following values of Number
:
Plur
(6734; 25% of non-emptyNumber
): лет, человек, км, годах, годы, данным, женщин, годов, войска, км2Sing
(19915; 75% of non-emptyNumber
): года, году, время, области, войны, год, реки, г., города, районеEMPTY
(11): Бук, Крылья, М, Подземьем, автомата, в, и, майоры, племя, поста
ADJ
12480 ru-pos/ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Animacy=Inan (11174; 90%).
ADJ
tokens may have the following values of Number
:
Plur
(2837; 23% of non-emptyNumber
): х, других, некоторые, различных, многие, таких, первые, самых, такие, новыеSing
(9643; 77% of non-emptyNumber
): второй, й, 2008, 2010, 2004, первый, 2012, 1, 2006, 2009EMPTY
(48): старше, выше, большее, большей, мельче, меньше, 2012-13, 402, бóльшей, бо́льшее
VERB
8140 ru-pos/VERB tokens (86% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: Voice=EMPTY (6039; 74%), Case=EMPTY (6037; 74%), Animacy=EMPTY (6036; 74%), Mood=Ind (6007; 74%), Person=EMPTY (5960; 73%), Tense=Past (5560; 68%), Aspect=Imp (4538; 56%).
VERB
tokens may have the following values of Number
:
Plur
(2082; 26% of non-emptyNumber
): были, могут, являются, имеют, стали, используются, называют, находятся, будут, моглиSing
(6058; 74% of non-emptyNumber
): был, было, была, является, стал, составляет, может, находится, входит, получилEMPTY
(1296): быть, можно, нет, будучи, включая, начиная, заниматься, играть, сделать, использовать
PROPN
7603 ru-pos/PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PROPN
and Number
co-occurred: Gender=Masc (5255; 69%), Animacy=Inan (4189; 55%).
PROPN
tokens may have the following values of Number
:
Plur
(239; 3% of non-emptyNumber
): США, ВВС, ВС, ЕХБ, СС, НЧ, Beatles, IPO, Лейкерс, НидерландовSing
(7364; 97% of non-emptyNumber
): России, СССР, декабря, января, сентября, марта, августа, июня, ноября, февраляEMPTY
(1): Pokémon
DET
1667 ru-pos/DET tokens (100% of all DET
tokens) have a non-empty value of Number
.
The most frequent other feature values with which DET
and Number
co-occurred: Animacy=Inan (1461; 88%).
DET
tokens may have the following values of Number
:
Plur
(424; 25% of non-emptyNumber
): которые, все, которых, всех, несколько, эти, этих, тех, the, теSing
(1243; 75% of non-emptyNumber
): это, который, этого, того, том, то, этом, тем, которой, этотEMPTY
(6): ., который, много, немного, несколько, т.
PRON
1424 ru-pos/PRON tokens (81% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: Reflex=EMPTY (1413; 99%), Person=3 (1183; 83%).
PRON
tokens may have the following values of Number
:
Plur
(342; 24% of non-emptyNumber
): их, они, них, им, мы, н., ними, вы, нам, нашихSing
(1082; 76% of non-emptyNumber
): его, он, её, она, что, ему, него, ней, я, нимEMPTY
(339): своей, себя, свою, свой, собой, своего, своих, свои, своё, своим
NUM
317 ru-pos/NUM tokens (17% of all NUM
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NUM
and Number
co-occurred: Animacy=Inan (250; 79%), Gender=Masc (214; 68%).
NUM
tokens may have the following values of Number
:
Plur
(11; 3% of non-emptyNumber
): двое, двух, обоих, 22, Оба, одних, три, трёхSing
(306; 97% of non-emptyNumber
): один, 1, одного, одной, одним, одна, одно, одну, одном, 21EMPTY
(1583): 2, два, 10, двух, 4, три, 3, 5, 20, 6
X
10 ru-pos/X tokens (1% of all X
tokens) have a non-empty value of Number
.
X
tokens may have the following values of Number
:
Sing
(10; 100% of non-emptyNumber
): T, f, x, ŠEŠ, FM, коеEMPTY
(1690): же, и, за, лишь, только, даже, юго, ещё, северо, 2
ADV
2 ru-pos/ADV tokens (0% of all ADV
tokens) have a non-empty value of Number
.
ADV
tokens may have the following values of Number
:
Sing
(2; 100% of non-emptyNumber
): prius, ВозможноEMPTY
(2140): более, как, так, только, вместе, затем, впервые, позже, здесь, менее
SCONJ
1 ru-pos/SCONJ tokens (0% of all SCONJ
tokens) have a non-empty value of Number
.
SCONJ
tokens may have the following values of Number
:
Sing
(1; 100% of non-emptyNumber
): чтоEMPTY
(623): что, где, когда, чтобы, как, так, хотя, если, поскольку, поэтому
SYM
1 ru-pos/SYM tokens (1% of all SYM
tokens) have a non-empty value of Number
.
SYM
tokens may have the following values of Number
:
Plur
(1; 100% of non-emptyNumber
): cmEMPTY
(157): %, /, +, *, °, =, $, €, justjared.com
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[amod]–> ADJ (9773; 98%),
NOUN –[nmod]–> NOUN (5428; 67%),
VERB –[nmod]–> NOUN (3327; 62%),
VERB –[nsubj]–> NOUN (2178; 94%),
NOUN –[conj]–> NOUN (1502; 81%),
NOUN –[nmod]–> PROPN (1319; 77%),
NOUN –[appos]–> PROPN (1146; 87%),
PROPN –[name]–> PROPN (990; 100%),
NOUN –[acl]–> VERB (908; 91%),
PROPN –[amod]–> ADJ (731; 99%).
Treebank Statistics (UD_Russian-SynTagRus)
This feature is universal.
It occurs with 2 different values: Plur
, Sing
.
528847 tokens (51%) have a non-empty value of Number
.
109581 types (99%) occur at least once with a non-empty value of Number
.
35741 lemmas (90%) occur at least once with a non-empty value of Number
.
The feature is used with 5 part-of-speech tags: ru-pos/NOUN (299480; 29% instances), ru-pos/ADJ (112445; 11% instances), ru-pos/VERB (91361; 9% instances), ru-pos/DET (18416; 2% instances), ru-pos/AUX (7145; 1% instances).
NOUN
299480 ru-pos/NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NOUN
and Number
co-occurred: Animacy=Inan (246602; 82%).
NOUN
tokens may have the following values of Number
:
Plur
(78705; 26% of non-emptyNumber
): лет, люди, людей, США, деньги, годы, тысяч, словам, стран, человекSing
(220775; 74% of non-emptyNumber
): это, года, России, время, того, году, том, этом, все, тоEMPTY
(118): интернет, ButtKicker, RoboCup, robots.txt, А, вся, нейтроно, паро, h1, А4
Paradigm ГОД | Sing | Plur |
---|---|---|
Case=Acc|Gender=Masc | год, г., г | годы, гг., г, г., гг |
Case=Dat|Gender=Masc | году, г, г. | годам |
Case=Gen|Gender=Masc | года, г., г | лет, годов, гг., г., гг, годах |
Case=Gen|Gender=Neut | лет | |
Case=Ins|Gender=Masc | годом, г., г | годами |
Case=Loc|Gender=Masc | году, г., г | годах, гг., гг, г. |
Case=Nom|Gender=Masc | год, г., г | годы, гг., года |
ADJ
112445 ru-pos/ADJ tokens (98% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Degree=Pos (111970; 100%).
ADJ
tokens may have the following values of Number
:
Plur
(36971; 33% of non-emptyNumber
): которые, которых, других, многие, должны, другие, новые, многих, последние, самиSing
(75474; 67% of non-emptyNumber
): который, один, которая, нужно, которой, другой, одной, сам, должен, которогоEMPTY
(1835): лучше, его, выше, ниже, больше, хуже, легче, меньше, проще, социально
Paradigm КОТОРЫЙ | Sing | Plur |
---|---|---|
Animacy=Anim|Case=Acc | которых | |
Animacy=Anim|Case=Acc|Gender=Masc | которого | |
Animacy=Inan|Case=Acc | которые | |
Animacy=Inan|Case=Acc|Gender=Masc | который | |
Animacy=Inan|Case=Acc|Gender=Neut | которые | |
Case=Acc|Gender=Fem | которую | |
Case=Acc|Gender=Neut | которое | |
Case=Dat | которым | |
Case=Dat|Gender=Masc | которому | |
Case=Dat|Gender=Fem | которой | |
Case=Dat|Gender=Neut | которому | |
Case=Gen | которых | |
Case=Gen|Gender=Masc | которого | |
Case=Gen|Gender=Fem | которой | |
Case=Gen|Gender=Neut | которого | |
Case=Ins | которыми | |
Case=Ins|Gender=Masc | которым | |
Case=Ins|Gender=Fem | которой | |
Case=Ins|Gender=Neut | которым | |
Case=Loc | которых | |
Case=Loc|Gender=Masc | котором | |
Case=Loc|Gender=Fem | которой | |
Case=Loc|Gender=Neut | котором | |
Case=Nom | которые | |
Case=Nom|Gender=Masc | который | |
Case=Nom|Gender=Fem | которая | |
Case=Nom|Gender=Neut | которое |
VERB
91361 ru-pos/VERB tokens (78% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: Case=EMPTY (79234; 87%), Voice=Act (77333; 85%), VerbForm=Fin (74078; 81%), Mood=Ind (73100; 80%), Gender=EMPTY (55791; 61%), Person=EMPTY (53490; 59%), Aspect=Imp (52901; 58%), Tense=Past (48524; 53%).
VERB
tokens may have the following values of Number
:
Plur
(31603; 35% of non-emptyNumber
): могут, есть, стали, говорят, могли, имеют, скажем, являются, сообщили, былиSing
(59758; 65% of non-emptyNumber
): может, нет, есть, было, является, стал, сказал, говорит, стало, стоитEMPTY
(25931): быть, сделать, сказать, делать, говорить, получить, работать, стать, говоря, иметь
Paradigm МОЧЬ | Sing | Plur |
---|---|---|
Aspect=Imp|Case=Acc|Gender=Fem|Tense=Pres|VerbForm=Part | могущую | |
Aspect=Imp|Case=Gen|Tense=Pres|VerbForm=Part | могущих | |
Aspect=Imp|Case=Nom|Gender=Neut|Tense=Pres|VerbForm=Part | могущее | |
Aspect=Imp|Case=Nom|Tense=Pres|VerbForm=Part | могущие | |
Aspect=Imp|Gender=Masc|Mood=Ind|Tense=Past|VerbForm=Fin | мог | |
Aspect=Imp|Gender=Fem|Mood=Ind|Tense=Past|VerbForm=Fin | могла | |
Aspect=Imp|Gender=Neut|Mood=Ind|Tense=Past|VerbForm=Fin | могло | |
Aspect=Imp|Mood=Ind|Person=1|Tense=Pres|VerbForm=Fin | могу | можем |
Aspect=Imp|Mood=Ind|Person=2|Tense=Pres|VerbForm=Fin | можешь | можете |
Aspect=Imp|Mood=Ind|Person=3|Tense=Pres|VerbForm=Fin | может | могут |
Aspect=Imp|Mood=Ind|Tense=Past|VerbForm=Fin | могли | |
Aspect=Perf|Gender=Masc|Mood=Ind|Tense=Past|VerbForm=Fin | смог | |
Aspect=Perf|Gender=Fem|Mood=Ind|Tense=Past|VerbForm=Fin | смогла | |
Aspect=Perf|Gender=Neut|Mood=Ind|Tense=Past|VerbForm=Fin | смогло | |
Aspect=Perf|Mood=Ind|Person=1|Tense=Fut|VerbForm=Fin | смогу | сможем |
Aspect=Perf|Mood=Ind|Person=2|Tense=Fut|VerbForm=Fin | сможешь | сможете |
Aspect=Perf|Mood=Ind|Person=3|Tense=Fut|VerbForm=Fin | сможет | смогут |
Aspect=Perf|Mood=Ind|Tense=Past|VerbForm=Fin | смогли |
DET
18416 ru-pos/DET tokens (87% of all DET
tokens) have a non-empty value of Number
.
DET
tokens may have the following values of Number
:
Plur
(5967; 32% of non-emptyNumber
): все, эти, всех, этих, свои, своих, таких, такие, наши, некоторыеSing
(12449; 68% of non-emptyNumber
): этот, этой, этого, этом, своей, свою, это, эта, такой, нашейEMPTY
(2811): его, их, ее, её
Paradigm ЭТОТ | Sing | Plur |
---|---|---|
Case=Acc | эти, этих | |
Case=Acc|Gender=Masc | этот, этого, это | |
Case=Acc|Gender=Fem | эту | |
Case=Acc|Gender=Neut | это | |
Case=Dat | этим | |
Case=Dat|Gender=Masc | этому | |
Case=Dat|Gender=Fem | этой | |
Case=Dat|Gender=Neut | этому | |
Case=Gen | этих | |
Case=Gen|Gender=Masc | этого | |
Case=Gen|Gender=Fem | этой | |
Case=Gen|Gender=Neut | этого | |
Case=Ins | этими | |
Case=Ins|Gender=Masc | этим | |
Case=Ins|Gender=Fem | этой | |
Case=Ins|Gender=Neut | этим | |
Case=Loc | этих | |
Case=Loc|Gender=Masc | этом | |
Case=Loc|Gender=Fem | этой | |
Case=Loc|Gender=Neut | этом | |
Case=Nom | эти | |
Case=Nom|Gender=Masc | этот | |
Case=Nom|Gender=Fem | эта | |
Case=Nom|Gender=Neut | это |
AUX
7145 ru-pos/AUX tokens (91% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: Voice=Act (7145; 100%), Aspect=Imp (7145; 100%), VerbForm=Fin (7141; 100%), Mood=Ind (7115; 100%), Tense=Past (5133; 72%), Person=EMPTY (5133; 72%).
AUX
tokens may have the following values of Number
:
Plur
(1817; 25% of non-emptyNumber
): были, будут, будем, есть, будете, будьте, бывшие, сутьSing
(5328; 75% of non-emptyNumber
): было, был, будет, была, есть, буду, будь, будешь, бывшем, бывшийEMPTY
(748): быть, будучи
Paradigm БЫТЬ | Sing | Plur |
---|---|---|
Case=Loc|Gender=Masc|Tense=Past|VerbForm=Part | бывшем | |
Case=Nom|Gender=Masc|Tense=Past|VerbForm=Part | бывший | |
Case=Nom|Tense=Past|VerbForm=Part | бывшие | |
Gender=Masc|Mood=Ind|Tense=Past|VerbForm=Fin | был | |
Gender=Fem|Mood=Ind|Tense=Past|VerbForm=Fin | была | |
Gender=Neut|Mood=Ind|Tense=Past|VerbForm=Fin | было | |
Mood=Imp|Person=2|VerbForm=Fin | будь | будьте |
Mood=Ind|Person=1|Tense=Pres|VerbForm=Fin | буду, есть | будем |
Mood=Ind|Person=2|Tense=Pres|VerbForm=Fin | будешь, есть | будете, есть |
Mood=Ind|Person=3|Tense=Pres|VerbForm=Fin | будет, есть | будут, есть, суть |
Mood=Ind|Tense=Past|VerbForm=Fin | были |
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[amod]–> ADJ (81185; 99%),
VERB –[nsubj]–> NOUN (36465; 94%),
NOUN –[nmod]–> NOUN (33404; 62%),
VERB –[nmod]–> NOUN (23092; 50%),
NOUN –[dobj]–> NOUN (19107; 64%),
NOUN –[det]–> DET (18281; 86%),
NOUN –[conj]–> NOUN (17338; 81%),
NOUN –[amod]–> VERB (10261; 99%),
VERB –[conj]–> VERB (9788; 80%),
NOUN –[appos]–> NOUN (6745; 94%).
Number in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fi] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]