Gender: gender
Gender is a lexical feature of nouns and inflectional feature of other parts of speech (adjectives, verbs) that mark agreement with nouns. There are three values of gender: masculine, feminine, and neuter.
See also the related feature of Animacy.
Masc: masculine gender
Nouns denoting male persons are masculine. Other nouns may be also grammatically masculine, without any relation to sex.
Examples
- мужчина “man”
- замок “castle”
- грузовик “truck”
- председатель “chairman”
- судья “judge”
Fem: feminine gender
Nouns denoting female persons are feminine. Other nouns may be also grammatically feminine, without any relation to sex.
Examples
- женщина “woman”
- роза “rose”
- песня “song”
- кость “bone”
Neut: neuter gender
This third gender is for nouns that are neither masculine nor feminine (grammatically). Nouns whose nominative suffix is -о or -е (including a large group of deverbative nouns denoting actions) are usually neuter.
Examples
- место “place”
- море “sea”
- мясо “meat”
- здание “building”
Treebank Statistics (UD_Russian)
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
44287 tokens (45%) have a non-empty value of Gender.
21516 types (72%) occur at least once with a non-empty value of Gender.
1 lemmas (0) occur at least once with a non-empty value of Gender.
The feature is used with 10 part-of-speech tags: ru-pos/NOUN (19921; 20% instances), ru-pos/ADJ (9645; 10% instances), ru-pos/PROPN (7367; 7% instances), ru-pos/VERB (4485; 5% instances), ru-pos/DET (1243; 1% instances), ru-pos/PRON (1018; 1% instances), ru-pos/NUM (595; 1% instances), ru-pos/X (10; 0% instances), ru-pos/ADV (2; 0% instances), ru-pos/SCONJ (1; 0% instances).
NOUN
19921 ru-pos/NOUN tokens (75% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (19909; 100%), Animacy=Inan (17838; 90%).
NOUN tokens may have the following values of Gender:
Fem(6475; 33% of non-emptyGender): области, войны, реки, часть, территории, площадь, части, компании, армии, группыMasc(9313; 47% of non-emptyGender): года, году, год, г., города, районе, состав, мира, века, составеNeut(4133; 21% of non-emptyGender): время, население, населения, название, место, начале, качестве, село, времени, участиеEMPTY(6739): лет, человек, км, годах, годы, данным, женщин, годов, войска, км2
ADJ
9645 ru-pos/ADJ tokens (77% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (9640; 100%), Animacy=Inan (8765; 91%).
ADJ tokens may have the following values of Gender:
Fem(2764; 29% of non-emptyGender): второй, российской, й, первой, я, отечественной, большую, мировой, новой, центральнойMasc(5145; 53% of non-emptyGender): 2008, 2010, 2004, первый, 2012, 2006, 2009, 2011, 2007, 2001Neut(1736; 18% of non-emptyGender): 1, 12, настоящее, 15, 14, 11, 21, 23, 29, первоеEMPTY(2883): х, других, некоторые, различных, многие, таких, первые, самых, такие, новые
PROPN
7367 ru-pos/PROPN tokens (97% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (7363; 100%), Animacy=Inan (4032; 55%).
PROPN tokens may have the following values of Gender:
Fem(1871; 25% of non-emptyGender): России, Украины, Франции, Германии, Европы, Испании, РФ, Москве, Франция, АнглииMasc(5256; 71% of non-emptyGender): СССР, декабря, января, сентября, августа, июня, марта, ноября, февраля, апреляNeut(240; 3% of non-emptyGender): ISO, Дубно, Евровидение, Марокко, ЦРУ, MonaVie, Григорово, Динамо, Домодедово, ЗакарпатьеEMPTY(237): США, ВВС, ВС, ЕХБ, СС, НЧ, Beatles, IPO, Лейкерс, Нидерландов
VERB
4485 ru-pos/VERB tokens (48% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Number=Sing (4484; 100%), Person=EMPTY (4469; 100%), Tense=Past (4225; 94%), Voice=EMPTY (3035; 68%), Case=EMPTY (3033; 68%), Animacy=EMPTY (3032; 68%), Mood=Ind (3031; 68%), Aspect=Perf (2654; 59%).
VERB tokens may have the following values of Gender:
Fem(1091; 24% of non-emptyGender): была, стала, получила, основана, расположена, создана, вошла, появилась, вышла, род.Masc(2653; 59% of non-emptyGender): был, стал, получил, родился, начал, работал, окончил, назначен, участвовал, вышелNeut(741; 17% of non-emptyGender): было, составляло, стало, удалось, привело, расположено, принято, пришлось, проживало, произошлоEMPTY(4951): были, является, составляет, может, находится, быть, входит, можно, имеет, есть
DET
1243 ru-pos/DET tokens (74% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (1242; 100%), Animacy=Inan (1140; 92%).
DET tokens may have the following values of Gender:
Fem(222; 18% of non-emptyGender): которой, которая, этой, эта, всей, эту, которую, всю, the, какойMasc(398; 32% of non-emptyGender): который, этот, этого, которого, the, котором, этом, тот, которому, весьNeut(623; 50% of non-emptyGender): это, того, том, то, тем, этого, этом, всего, которое, всеEMPTY(430): которые, все, которых, всех, несколько, эти, этих, тех, the, те
PRON
1018 ru-pos/PRON tokens (58% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (1018; 100%), Reflex=EMPTY (1016; 100%), Person=3 (930; 91%).
PRON tokens may have the following values of Gender:
Fem(242; 24% of non-emptyGender): её, она, ней, неё, ей, ее, нее, Her, ею, собойMasc(670; 66% of non-emptyGender): его, он, ему, него, ним, им, нём, кто, нему, немNeut(106; 10% of non-emptyGender): что, оно, чего, его, чем, чём, него, чему, Тем, ееEMPTY(745): их, они, своей, себя, них, свою, собой, свой, своего, я
NUM
595 ru-pos/NUM tokens (31% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: Animacy=Inan (483; 81%), Number=Sing (303; 51%).
NUM tokens may have the following values of Gender:
Fem(142; 24% of non-emptyGender): одной, две, одна, двух, одну, 2, 1, обе, двум, двумяMasc(421; 71% of non-emptyGender): один, два, 2, 1, одного, двух, одним, 22, оба, 21Neut(32; 5% of non-emptyGender): одно, одним, одного, 2, два, двух, одном, 1, 12, 22EMPTY(1305): 10, 4, три, 3, 5, 20, 6, четыре, 16, 15
X
10 ru-pos/X tokens (1% of all X tokens) have a non-empty value of Gender.
X tokens may have the following values of Gender:
Fem(2; 20% of non-emptyGender): fMasc(6; 60% of non-emptyGender): x, ŠEŠ, FM, TNeut(2; 20% of non-emptyGender): T, коеEMPTY(1690): же, и, за, лишь, только, даже, юго, ещё, северо, 2
ADV
2 ru-pos/ADV tokens (0% of all ADV tokens) have a non-empty value of Gender.
ADV tokens may have the following values of Gender:
Masc(1; 50% of non-emptyGender): priusNeut(1; 50% of non-emptyGender): ВозможноEMPTY(2140): более, как, так, только, вместе, затем, впервые, позже, здесь, менее
SCONJ
1 ru-pos/SCONJ tokens (0% of all SCONJ tokens) have a non-empty value of Gender.
SCONJ tokens may have the following values of Gender:
Neut(1; 100% of non-emptyGender): чтоEMPTY(623): что, где, когда, чтобы, как, так, хотя, если, поскольку, поэтому
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (7406; 98%),
PROPN –[name]–> PROPN (981; 99%),
NOUN –[appos]–> PROPN (781; 60%),
NOUN –[acl]–> VERB (527; 86%),
VERB –[nsubj]–> PROPN (457; 70%),
NOUN –[det]–> DET (440; 97%),
PROPN –[conj]–> PROPN (411; 72%),
VERB –[auxpass]–> VERB (403; 95%),
VERB –[nsubjpass]–> NOUN (385; 93%),
PROPN –[nmod]–> NOUN (383; 81%).
Treebank Statistics (UD_Russian-SynTagRus)
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
426230 tokens (41%) have a non-empty value of Gender.
86665 types (79%) occur at least once with a non-empty value of Gender.
32791 lemmas (82%) occur at least once with a non-empty value of Gender.
The feature is used with 6 part-of-speech tags: ru-pos/NOUN (297781; 29% instances), ru-pos/ADJ (75474; 7% instances), ru-pos/VERB (35570; 3% instances), ru-pos/DET (12449; 1% instances), ru-pos/AUX (4022; 0% instances), ru-pos/NUM (934; 0% instances).
NOUN
297781 ru-pos/NOUN tokens (99% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Animacy=Inan (245803; 83%), Number=Sing (220773; 74%).
NOUN tokens may have the following values of Gender:
Fem(96446; 32% of non-emptyGender): России, жизни, власти, страны, деньги, работы, жизнь, экономики, системы, странеMasc(135820; 46% of non-emptyGender): года, лет, году, человек, люди, людей, раз, человека, случае, вопросNeut(65515; 22% of non-emptyGender): это, время, того, том, этом, все, то, тем, этого, делоEMPTY(1817): США, все, тех, всех, данным, те, данные, всем, данных, тем
| Paradigm ТО | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc | то | ||
| Case=Dat | тому | ||
| Case=Gen | того | того | |
| Case=Ins | тем | тем | |
| Case=Loc | том | ||
| Case=Nom | то |
Gender seems to be lexical feature of NOUN. 99% lemmas (21689) occur only with one value of Gender.
ADJ
75474 ru-pos/ADJ tokens (66% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (75474; 100%), Degree=Pos (75212; 100%).
ADJ tokens may have the following values of Gender:
Fem(27138; 36% of non-emptyGender): которая, которой, одной, российской, одна, должна, которую, другой, новой, самойMasc(29562; 39% of non-emptyGender): который, один, сам, должен, первый, которого, одного, новый, самый, другойNeut(18774; 25% of non-emptyGender): нужно, которое, самом, известно, одно, необходимо, самое, невозможно, должно, важноEMPTY(38806): которые, которых, других, многие, должны, другие, новые, многих, последние, сами
| Paradigm КОТОРЫЙ | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | которого | ||
| Animacy=Inan|Case=Acc | который | которые | |
| Case=Acc | которую | которое | |
| Case=Dat | которому | которой | которому |
| Case=Gen | которого | которой | которого |
| Case=Ins | которым | которой | которым |
| Case=Loc | котором | которой | котором |
| Case=Nom | который | которая | которое |
VERB
35570 ru-pos/VERB tokens (30% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Number=Sing (35570; 100%), Person=EMPTY (35570; 100%), Tense=Past (32886; 92%), Case=EMPTY (28700; 81%), Voice=Act (27943; 79%), VerbForm=Fin (25093; 71%), Mood=Ind (25093; 71%), Aspect=Perf (22400; 63%).
VERB tokens may have the following values of Gender:
Fem(9289; 26% of non-emptyGender): стала, могла, сказала, была, оказалась, появилась, шла, началась, пришла, окружающейMasc(18582; 52% of non-emptyGender): стал, сказал, мог, заявил, был, сообщил, говорил, оказался, видел, началNeut(7699; 22% of non-emptyGender): было, стало, удалось, оказалось, казалось, произошло, пришлось, могло, выяснилось, хотелосьEMPTY(81722): может, есть, нет, могут, является, быть, говорит, стоит, стали, сделать
| Paradigm МОЧЬ | Masc | Fem | Neut |
|---|---|---|---|
| Aspect=Imp|Case=Acc|Tense=Pres|VerbForm=Part | могущую | ||
| Aspect=Imp|Case=Nom|Tense=Pres|VerbForm=Part | могущее | ||
| Aspect=Imp|Mood=Ind|Tense=Past|VerbForm=Fin | мог | могла | могло |
| Aspect=Perf|Mood=Ind|Tense=Past|VerbForm=Fin | смог | смогла | смогло |
DET
12449 ru-pos/DET tokens (59% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (12449; 100%).
DET tokens may have the following values of Gender:
Fem(4620; 37% of non-emptyGender): этой, своей, свою, эта, нашей, эту, всей, такой, такая, всюMasc(4688; 38% of non-emptyGender): этот, этом, этого, свой, таким, своего, такой, каждый, наш, тотNeut(3141; 25% of non-emptyGender): это, все, том, свое, то, этого, такое, этом, своего, нашеEMPTY(8778): его, их, все, эти, ее, всех, этих, свои, своих, таких
| Paradigm ЭТОТ | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc | этот, этого, это | эту | это |
| Case=Dat | этому | этой | этому |
| Case=Gen | этого | этой | этого |
| Case=Ins | этим | этой | этим |
| Case=Loc | этом | этой | этом |
| Case=Nom | этот | эта | это |
AUX
4022 ru-pos/AUX tokens (51% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Tense=Past (4022; 100%), Person=EMPTY (4022; 100%), Number=Sing (4022; 100%), Aspect=Imp (4022; 100%), Voice=Act (4022; 100%), Mood=Ind (4020; 100%), VerbForm=Fin (4020; 100%).
AUX tokens may have the following values of Gender:
Fem(902; 22% of non-emptyGender): былаMasc(1478; 37% of non-emptyGender): был, бывшем, бывшийNeut(1642; 41% of non-emptyGender): былоEMPTY(3871): были, будет, быть, будут, есть, будем, буду, будучи, будь, будете
| Paradigm БЫТЬ | Masc | Fem | Neut |
|---|---|---|---|
| Case=Loc|VerbForm=Part | бывшем | ||
| Case=Nom|VerbForm=Part | бывший | ||
| Mood=Ind|VerbForm=Fin | был | была | было |
NUM
934 ru-pos/NUM tokens (7% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: Case=Acc (504; 54%).
NUM tokens may have the following values of Gender:
Fem(289; 31% of non-emptyGender): две, обе, обеих, обеим, обеими, двух, полторыMasc(570; 61% of non-emptyGender): два, полтора, оба, обоих, двух, обоим, обоими, INeut(75; 8% of non-emptyGender): два, оба, полтора, обоихEMPTY(12346): несколько, три, 1, 10, двух, 20, 2, 15, 5, 3
| Paradigm ДВА | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | двух | двух | |
| Animacy=Inan|Case=Acc | два | две | |
| Case=Acc | два | ||
| Case=Nom | два | две | два |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (53997; 66%),
NOUN –[det]–> DET (12412; 59%),
NOUN –[conj]–> NOUN (10983; 51%),
NOUN –[amod]–> VERB (5874; 57%),
NOUN –[appos]–> NOUN (5604; 78%),
NOUN –[name]–> NOUN (4996; 99%),
ADJ –[nsubj]–> NOUN (3676; 66%),
VERB –[conj]–> VERB (3223; 54%),
ADJ –[conj]–> ADJ (2652; 95%),
VERB –[auxpass]–> AUX (1312; 76%).
Gender in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]