Gender
: gender
Gender is a lexical feature of nouns and inflectional feature of other parts of speech (adjectives, verbs) that mark agreement with nouns. There are three values of gender: masculine, feminine, and neuter.
See also the related feature of Animacy.
Masc
: masculine gender
Nouns denoting male persons are masculine. Other nouns may be also grammatically masculine, without any relation to sex.
Examples
- мужчина “man”
- замок “castle”
- грузовик “truck”
- председатель “chairman”
- судья “judge”
Fem
: feminine gender
Nouns denoting female persons are feminine. Other nouns may be also grammatically feminine, without any relation to sex.
Examples
- женщина “woman”
- роза “rose”
- песня “song”
- кость “bone”
Neut
: neuter gender
This third gender is for nouns that are neither masculine nor feminine (grammatically). Nouns whose nominative suffix is -о or -е (including a large group of deverbative nouns denoting actions) are usually neuter.
Examples
- место “place”
- море “sea”
- мясо “meat”
- здание “building”
Treebank Statistics (UD_Russian)
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
44287 tokens (45%) have a non-empty value of Gender
.
21516 types (72%) occur at least once with a non-empty value of Gender
.
1 lemmas (0) occur at least once with a non-empty value of Gender
.
The feature is used with 10 part-of-speech tags: ru-pos/NOUN (19921; 20% instances), ru-pos/ADJ (9645; 10% instances), ru-pos/PROPN (7367; 7% instances), ru-pos/VERB (4485; 5% instances), ru-pos/DET (1243; 1% instances), ru-pos/PRON (1018; 1% instances), ru-pos/NUM (595; 1% instances), ru-pos/X (10; 0% instances), ru-pos/ADV (2; 0% instances), ru-pos/SCONJ (1; 0% instances).
NOUN
19921 ru-pos/NOUN tokens (75% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (19909; 100%), Animacy=Inan (17838; 90%).
NOUN
tokens may have the following values of Gender
:
Fem
(6475; 33% of non-emptyGender
): области, войны, реки, часть, территории, площадь, части, компании, армии, группыMasc
(9313; 47% of non-emptyGender
): года, году, год, г., города, районе, состав, мира, века, составеNeut
(4133; 21% of non-emptyGender
): время, население, населения, название, место, начале, качестве, село, времени, участиеEMPTY
(6739): лет, человек, км, годах, годы, данным, женщин, годов, войска, км2
ADJ
9645 ru-pos/ADJ tokens (77% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (9640; 100%), Animacy=Inan (8765; 91%).
ADJ
tokens may have the following values of Gender
:
Fem
(2764; 29% of non-emptyGender
): второй, российской, й, первой, я, отечественной, большую, мировой, новой, центральнойMasc
(5145; 53% of non-emptyGender
): 2008, 2010, 2004, первый, 2012, 2006, 2009, 2011, 2007, 2001Neut
(1736; 18% of non-emptyGender
): 1, 12, настоящее, 15, 14, 11, 21, 23, 29, первоеEMPTY
(2883): х, других, некоторые, различных, многие, таких, первые, самых, такие, новые
PROPN
7367 ru-pos/PROPN tokens (97% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (7363; 100%), Animacy=Inan (4032; 55%).
PROPN
tokens may have the following values of Gender
:
Fem
(1871; 25% of non-emptyGender
): России, Украины, Франции, Германии, Европы, Испании, РФ, Москве, Франция, АнглииMasc
(5256; 71% of non-emptyGender
): СССР, декабря, января, сентября, августа, июня, марта, ноября, февраля, апреляNeut
(240; 3% of non-emptyGender
): ISO, Дубно, Евровидение, Марокко, ЦРУ, MonaVie, Григорово, Динамо, Домодедово, ЗакарпатьеEMPTY
(237): США, ВВС, ВС, ЕХБ, СС, НЧ, Beatles, IPO, Лейкерс, Нидерландов
VERB
4485 ru-pos/VERB tokens (48% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (4484; 100%), Person=EMPTY (4469; 100%), Tense=Past (4225; 94%), Voice=EMPTY (3035; 68%), Case=EMPTY (3033; 68%), Animacy=EMPTY (3032; 68%), Mood=Ind (3031; 68%), Aspect=Perf (2654; 59%).
VERB
tokens may have the following values of Gender
:
Fem
(1091; 24% of non-emptyGender
): была, стала, получила, основана, расположена, создана, вошла, появилась, вышла, род.Masc
(2653; 59% of non-emptyGender
): был, стал, получил, родился, начал, работал, окончил, назначен, участвовал, вышелNeut
(741; 17% of non-emptyGender
): было, составляло, стало, удалось, привело, расположено, принято, пришлось, проживало, произошлоEMPTY
(4951): были, является, составляет, может, находится, быть, входит, можно, имеет, есть
DET
1243 ru-pos/DET tokens (74% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (1242; 100%), Animacy=Inan (1140; 92%).
DET
tokens may have the following values of Gender
:
Fem
(222; 18% of non-emptyGender
): которой, которая, этой, эта, всей, эту, которую, всю, the, какойMasc
(398; 32% of non-emptyGender
): который, этот, этого, которого, the, котором, этом, тот, которому, весьNeut
(623; 50% of non-emptyGender
): это, того, том, то, тем, этого, этом, всего, которое, всеEMPTY
(430): которые, все, которых, всех, несколько, эти, этих, тех, the, те
PRON
1018 ru-pos/PRON tokens (58% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (1018; 100%), Reflex=EMPTY (1016; 100%), Person=3 (930; 91%).
PRON
tokens may have the following values of Gender
:
Fem
(242; 24% of non-emptyGender
): её, она, ней, неё, ей, ее, нее, Her, ею, собойMasc
(670; 66% of non-emptyGender
): его, он, ему, него, ним, им, нём, кто, нему, немNeut
(106; 10% of non-emptyGender
): что, оно, чего, его, чем, чём, него, чему, Тем, ееEMPTY
(745): их, они, своей, себя, них, свою, собой, свой, своего, я
NUM
595 ru-pos/NUM tokens (31% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: Animacy=Inan (483; 81%), Number=Sing (303; 51%).
NUM
tokens may have the following values of Gender
:
Fem
(142; 24% of non-emptyGender
): одной, две, одна, двух, одну, 2, 1, обе, двум, двумяMasc
(421; 71% of non-emptyGender
): один, два, 2, 1, одного, двух, одним, 22, оба, 21Neut
(32; 5% of non-emptyGender
): одно, одним, одного, 2, два, двух, одном, 1, 12, 22EMPTY
(1305): 10, 4, три, 3, 5, 20, 6, четыре, 16, 15
X
10 ru-pos/X tokens (1% of all X
tokens) have a non-empty value of Gender
.
X
tokens may have the following values of Gender
:
Fem
(2; 20% of non-emptyGender
): fMasc
(6; 60% of non-emptyGender
): x, ŠEŠ, FM, TNeut
(2; 20% of non-emptyGender
): T, коеEMPTY
(1690): же, и, за, лишь, только, даже, юго, ещё, северо, 2
ADV
2 ru-pos/ADV tokens (0% of all ADV
tokens) have a non-empty value of Gender
.
ADV
tokens may have the following values of Gender
:
Masc
(1; 50% of non-emptyGender
): priusNeut
(1; 50% of non-emptyGender
): ВозможноEMPTY
(2140): более, как, так, только, вместе, затем, впервые, позже, здесь, менее
SCONJ
1 ru-pos/SCONJ tokens (0% of all SCONJ
tokens) have a non-empty value of Gender
.
SCONJ
tokens may have the following values of Gender
:
Neut
(1; 100% of non-emptyGender
): чтоEMPTY
(623): что, где, когда, чтобы, как, так, хотя, если, поскольку, поэтому
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (7406; 98%),
PROPN –[name]–> PROPN (981; 99%),
NOUN –[appos]–> PROPN (781; 60%),
NOUN –[acl]–> VERB (527; 86%),
VERB –[nsubj]–> PROPN (457; 70%),
NOUN –[det]–> DET (440; 97%),
PROPN –[conj]–> PROPN (411; 72%),
VERB –[auxpass]–> VERB (403; 95%),
VERB –[nsubjpass]–> NOUN (385; 93%),
PROPN –[nmod]–> NOUN (383; 81%).
Treebank Statistics (UD_Russian-SynTagRus)
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
426230 tokens (41%) have a non-empty value of Gender
.
86665 types (79%) occur at least once with a non-empty value of Gender
.
32791 lemmas (82%) occur at least once with a non-empty value of Gender
.
The feature is used with 6 part-of-speech tags: ru-pos/NOUN (297781; 29% instances), ru-pos/ADJ (75474; 7% instances), ru-pos/VERB (35570; 3% instances), ru-pos/DET (12449; 1% instances), ru-pos/AUX (4022; 0% instances), ru-pos/NUM (934; 0% instances).
NOUN
297781 ru-pos/NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (245803; 83%), Number=Sing (220773; 74%).
NOUN
tokens may have the following values of Gender
:
Fem
(96446; 32% of non-emptyGender
): России, жизни, власти, страны, деньги, работы, жизнь, экономики, системы, странеMasc
(135820; 46% of non-emptyGender
): года, лет, году, человек, люди, людей, раз, человека, случае, вопросNeut
(65515; 22% of non-emptyGender
): это, время, того, том, этом, все, то, тем, этого, делоEMPTY
(1817): США, все, тех, всех, данным, те, данные, всем, данных, тем
Paradigm ТО | Masc | Fem | Neut |
---|---|---|---|
Case=Acc | то | ||
Case=Dat | тому | ||
Case=Gen | того | того | |
Case=Ins | тем | тем | |
Case=Loc | том | ||
Case=Nom | то |
Gender
seems to be lexical feature of NOUN
. 99% lemmas (21689) occur only with one value of Gender
.
ADJ
75474 ru-pos/ADJ tokens (66% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (75474; 100%), Degree=Pos (75212; 100%).
ADJ
tokens may have the following values of Gender
:
Fem
(27138; 36% of non-emptyGender
): которая, которой, одной, российской, одна, должна, которую, другой, новой, самойMasc
(29562; 39% of non-emptyGender
): который, один, сам, должен, первый, которого, одного, новый, самый, другойNeut
(18774; 25% of non-emptyGender
): нужно, которое, самом, известно, одно, необходимо, самое, невозможно, должно, важноEMPTY
(38806): которые, которых, других, многие, должны, другие, новые, многих, последние, сами
Paradigm КОТОРЫЙ | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | которого | ||
Animacy=Inan|Case=Acc | который | которые | |
Case=Acc | которую | которое | |
Case=Dat | которому | которой | которому |
Case=Gen | которого | которой | которого |
Case=Ins | которым | которой | которым |
Case=Loc | котором | которой | котором |
Case=Nom | который | которая | которое |
VERB
35570 ru-pos/VERB tokens (30% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (35570; 100%), Person=EMPTY (35570; 100%), Tense=Past (32886; 92%), Case=EMPTY (28700; 81%), Voice=Act (27943; 79%), VerbForm=Fin (25093; 71%), Mood=Ind (25093; 71%), Aspect=Perf (22400; 63%).
VERB
tokens may have the following values of Gender
:
Fem
(9289; 26% of non-emptyGender
): стала, могла, сказала, была, оказалась, появилась, шла, началась, пришла, окружающейMasc
(18582; 52% of non-emptyGender
): стал, сказал, мог, заявил, был, сообщил, говорил, оказался, видел, началNeut
(7699; 22% of non-emptyGender
): было, стало, удалось, оказалось, казалось, произошло, пришлось, могло, выяснилось, хотелосьEMPTY
(81722): может, есть, нет, могут, является, быть, говорит, стоит, стали, сделать
Paradigm МОЧЬ | Masc | Fem | Neut |
---|---|---|---|
Aspect=Imp|Case=Acc|Tense=Pres|VerbForm=Part | могущую | ||
Aspect=Imp|Case=Nom|Tense=Pres|VerbForm=Part | могущее | ||
Aspect=Imp|Mood=Ind|Tense=Past|VerbForm=Fin | мог | могла | могло |
Aspect=Perf|Mood=Ind|Tense=Past|VerbForm=Fin | смог | смогла | смогло |
DET
12449 ru-pos/DET tokens (59% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (12449; 100%).
DET
tokens may have the following values of Gender
:
Fem
(4620; 37% of non-emptyGender
): этой, своей, свою, эта, нашей, эту, всей, такой, такая, всюMasc
(4688; 38% of non-emptyGender
): этот, этом, этого, свой, таким, своего, такой, каждый, наш, тотNeut
(3141; 25% of non-emptyGender
): это, все, том, свое, то, этого, такое, этом, своего, нашеEMPTY
(8778): его, их, все, эти, ее, всех, этих, свои, своих, таких
Paradigm ЭТОТ | Masc | Fem | Neut |
---|---|---|---|
Case=Acc | этот, этого, это | эту | это |
Case=Dat | этому | этой | этому |
Case=Gen | этого | этой | этого |
Case=Ins | этим | этой | этим |
Case=Loc | этом | этой | этом |
Case=Nom | этот | эта | это |
AUX
4022 ru-pos/AUX tokens (51% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Tense=Past (4022; 100%), Person=EMPTY (4022; 100%), Number=Sing (4022; 100%), Aspect=Imp (4022; 100%), Voice=Act (4022; 100%), Mood=Ind (4020; 100%), VerbForm=Fin (4020; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(902; 22% of non-emptyGender
): былаMasc
(1478; 37% of non-emptyGender
): был, бывшем, бывшийNeut
(1642; 41% of non-emptyGender
): былоEMPTY
(3871): были, будет, быть, будут, есть, будем, буду, будучи, будь, будете
Paradigm БЫТЬ | Masc | Fem | Neut |
---|---|---|---|
Case=Loc|VerbForm=Part | бывшем | ||
Case=Nom|VerbForm=Part | бывший | ||
Mood=Ind|VerbForm=Fin | был | была | было |
NUM
934 ru-pos/NUM tokens (7% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: Case=Acc (504; 54%).
NUM
tokens may have the following values of Gender
:
Fem
(289; 31% of non-emptyGender
): две, обе, обеих, обеим, обеими, двух, полторыMasc
(570; 61% of non-emptyGender
): два, полтора, оба, обоих, двух, обоим, обоими, INeut
(75; 8% of non-emptyGender
): два, оба, полтора, обоихEMPTY
(12346): несколько, три, 1, 10, двух, 20, 2, 15, 5, 3
Paradigm ДВА | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | двух | двух | |
Animacy=Inan|Case=Acc | два | две | |
Case=Acc | два | ||
Case=Nom | два | две | два |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (53997; 66%),
NOUN –[det]–> DET (12412; 59%),
NOUN –[conj]–> NOUN (10983; 51%),
NOUN –[amod]–> VERB (5874; 57%),
NOUN –[appos]–> NOUN (5604; 78%),
NOUN –[name]–> NOUN (4996; 99%),
ADJ –[nsubj]–> NOUN (3676; 66%),
VERB –[conj]–> VERB (3223; 54%),
ADJ –[conj]–> ADJ (2652; 95%),
VERB –[auxpass]–> AUX (1312; 76%).
Gender in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]