Animacy
: animacy
Similarly to Gender, animacy is a lexical feature of nouns and inflectional feature of other parts of speech that mark agreement with nouns. It is independent of gender, therefore it is encoded separately in some tagsets (e.g. all the Multext-East tagsets).
Anim
: animate
Human beings, animals, fictional characters, names of professions etc. are all animate. Even nouns that are normally inanimate can be inflected as animate if they are personified. For instance, consider a children’s story about cars where cars live and talk as people; then the cars may become and be inflected as animates.
PDT examples of masculine animate nouns:
- человек “man”, министр “minister”, президент “president”, председатель “chairman”, режиссёр “director”
Inan
: inanimate
Nouns that are not animate are inanimate.
RNC (Russian Narional Corpus) examples of masculine inanimate nouns:
- род “year”, закон “law”, состояние “state”, падеж “case”, миллион “million”
Treebank Statistics (UD_Russian)
This feature is universal.
It occurs with 2 different values: Anim
, Inan
.
51516 tokens (52%) have a non-empty value of Animacy
.
26436 types (88%) occur at least once with a non-empty value of Animacy
.
1 lemmas (0) occur at least once with a non-empty value of Animacy
.
The feature is used with 11 part-of-speech tags: ru-pos/NOUN (26647; 27% instances), ru-pos/ADJ (12479; 13% instances), ru-pos/PROPN (7601; 8% instances), ru-pos/VERB (2104; 2% instances), ru-pos/DET (1666; 2% instances), ru-pos/NUM (909; 1% instances), ru-pos/PRON (96; 0% instances), ru-pos/X (10; 0% instances), ru-pos/ADV (2; 0% instances), ru-pos/SCONJ (1; 0% instances), ru-pos/SYM (1; 0% instances).
NOUN
26647 ru-pos/NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which NOUN
and Animacy
co-occurred: Number=Sing (19912; 75%).
NOUN
tokens may have the following values of Animacy
:
Anim
(3770; 14% of non-emptyAnimacy
): человек, человека, женщин, мужчин, членом, автор, детей, жителей, людей, деятельInan
(22877; 86% of non-emptyAnimacy
): года, году, время, области, лет, войны, реки, год, км, городаEMPTY
(13): Крылья, М, Подземьем, Точкой, в, векторы, восстания, друзьях, зоны, и
ADJ
12479 ru-pos/ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which ADJ
and Animacy
co-occurred: Number=Sing (9642; 77%).
ADJ
tokens may have the following values of Animacy
:
Anim
(1303; 10% of non-emptyAnimacy
): II, I, первым, сам, III, известный, американский, должен, многие, главныйInan
(11176; 90% of non-emptyAnimacy
): второй, й, 2008, 2010, х, 2004, 2012, 1, 2006, 2009EMPTY
(49): старше, выше, большее, большей, мельче, меньше, бóльшей, бо́льшее, больший, большую
PROPN
7601 ru-pos/PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which PROPN
and Animacy
co-occurred: Number=Sing (7362; 97%), Gender=Masc (5255; 69%).
PROPN
tokens may have the following values of Animacy
:
Anim
(3411; 45% of non-emptyAnimacy
): де, Александра, Владимир, Александр, Джон, Карл, Михаил, Сергей, Юрий, АлексейInan
(4190; 55% of non-emptyAnimacy
): России, США, СССР, декабря, января, сентября, марта, июня, августа, ноябряEMPTY
(3): Кастельон, Парфенки, Роуз
VERB
2104 ru-pos/VERB tokens (22% of all VERB
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which VERB
and Animacy
co-occurred: Mood=EMPTY (2102; 100%), Person=EMPTY (2100; 100%), Tense=Past (1685; 80%), Aspect=Perf (1582; 75%), Voice=Pass (1496; 71%), Number=Sing (1453; 69%), Case=Nom (1388; 66%).
VERB
tokens may have the following values of Animacy
:
Anim
(450; 21% of non-emptyAnimacy
): назначен, награждён, избран, вынужден, похоронен, произведён, ранен, убит, арестован, арестованыInan
(1654; 79% of non-emptyAnimacy
): расположен, основана, расположена, основан, создана, расположено, принято, расположены, назван, проведеныEMPTY
(7332): был, было, были, была, является, стал, составляет, может, находится, быть
DET
1666 ru-pos/DET tokens (100% of all DET
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which DET
and Animacy
co-occurred: Number=Sing (1242; 75%).
DET
tokens may have the following values of Animacy
:
Anim
(205; 12% of non-emptyAnimacy
): который, которые, все, the, всех, которого, которых, тех, которым, тотInan
(1461; 88% of non-emptyAnimacy
): это, того, том, этого, то, который, этом, тем, которые, всеEMPTY
(7): ., Это, который, много, немного, несколько, т.
NUM
909 ru-pos/NUM tokens (48% of all NUM
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which NUM
and Animacy
co-occurred: Number=EMPTY (592; 65%).
NUM
tokens may have the following values of Animacy
:
Anim
(158; 17% of non-emptyAnimacy
): один, одного, одним, двух, два, 1, двое, три, четырёх, 2Inan
(751; 83% of non-emptyAnimacy
): 2, два, 1, 4, двух, 3, три, один, одной, четыреEMPTY
(991): 10, 5, 20, 6, 16, 15, 18, 100, 12, 0
PRON
96 ru-pos/PRON tokens (5% of all PRON
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which PRON
and Animacy
co-occurred: Reflex=EMPTY (96; 100%), Person=EMPTY (94; 98%), Number=Sing (87; 91%), Gender=Neut (73; 76%), Case=Nom (54; 56%).
PRON
tokens may have the following values of Animacy
:
Anim
(20; 21% of non-emptyAnimacy
): кто, кем, кого, которымиInan
(76; 79% of non-emptyAnimacy
): что, чего, чем, чём, чему, который, н., никому, этогоEMPTY
(1667): его, он, их, её, она, они, своей, себя, ему, им
X
10 ru-pos/X tokens (1% of all X
tokens) have a non-empty value of Animacy
.
X
tokens may have the following values of Animacy
:
Anim
(2; 20% of non-emptyAnimacy
): ŠEŠInan
(8; 80% of non-emptyAnimacy
): T, f, x, FM, коеEMPTY
(1690): же, и, за, лишь, только, даже, юго, ещё, северо, 2
ADV
2 ru-pos/ADV tokens (0% of all ADV
tokens) have a non-empty value of Animacy
.
ADV
tokens may have the following values of Animacy
:
Inan
(2; 100% of non-emptyAnimacy
): prius, ВозможноEMPTY
(2140): более, как, так, только, вместе, затем, впервые, позже, здесь, менее
SYM
1 ru-pos/SYM tokens (1% of all SYM
tokens) have a non-empty value of Animacy
.
SYM
tokens may have the following values of Animacy
:
Inan
(1; 100% of non-emptyAnimacy
): cmEMPTY
(157): %, /, +, *, °, =, $, €, justjared.com
SCONJ
1 ru-pos/SCONJ tokens (0% of all SCONJ
tokens) have a non-empty value of Animacy
.
SCONJ
tokens may have the following values of Animacy
:
Inan
(1; 100% of non-emptyAnimacy
): чтоEMPTY
(623): что, где, когда, чтобы, как, так, хотя, если, поскольку, поэтому
Relations with Agreement in Animacy
The 10 most frequent relations where parent and child node agree in Animacy
:
NOUN –[amod]–> ADJ (9899; 100%),
NOUN –[nmod]–> NOUN (6452; 80%),
NOUN –[conj]–> NOUN (1763; 95%),
NOUN –[appos]–> PROPN (1236; 94%),
NOUN –[nmod]–> PROPN (1127; 65%),
PROPN –[name]–> PROPN (988; 99%),
NOUN –[acl]–> VERB (920; 92%),
NOUN –[appos]–> NOUN (767; 87%),
PROPN –[amod]–> ADJ (736; 100%),
NOUN –[det]–> DET (662; 99%).
Treebank Statistics (UD_Russian-SynTagRus)
This feature is universal.
It occurs with 2 different values: Anim
, Inan
.
312440 tokens (30%) have a non-empty value of Animacy
.
58390 types (53%) occur at least once with a non-empty value of Animacy
.
25073 lemmas (63%) occur at least once with a non-empty value of Animacy
.
The feature is used with 4 part-of-speech tags: ru-pos/NOUN (299510; 29% instances), ru-pos/ADJ (10452; 1% instances), ru-pos/VERB (1291; 0% instances), ru-pos/NUM (1187; 0% instances).
NOUN
299510 ru-pos/NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which NOUN
and Animacy
co-occurred: Number=Sing (220772; 74%).
NOUN
tokens may have the following values of Animacy
:
Anim
(52876; 18% of non-emptyAnimacy
): человек, люди, людей, человека, все, ученые, президента, Путин, В., президентInan
(246634; 82% of non-emptyAnimacy
): это, года, России, лет, время, того, году, том, этом, всеEMPTY
(88): ButtKicker, RoboCup, robots.txt, А, вся, h1, А4, СовЭкон, м2, +7-2=2
Paradigm ЧЕЛОВЕК | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing | человека | |
Case=Acc|Number=Plur | людей | |
Case=Dat|Number=Sing | человеку | |
Case=Dat|Number=Plur | людям | |
Case=Gen|Number=Sing | человека, чел. | |
Case=Gen|Number=Plur | людей, человек, чел., чел, человеков | чел |
Case=Ins|Number=Sing | человеком | |
Case=Ins|Number=Plur | людьми | |
Case=Loc|Number=Sing | человеке | |
Case=Loc|Number=Plur | людях | |
Case=Nom|Number=Sing | человек | |
Case=Nom|Number=Plur | люди |
Animacy
seems to be lexical feature of NOUN
. 99% lemmas (21645) occur only with one value of Animacy
.
ADJ
10452 ru-pos/ADJ tokens (9% of all ADJ
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which ADJ
and Animacy
co-occurred: Case=Acc (10451; 100%), Degree=Pos (10393; 99%), Number=Plur (5923; 57%), Gender=EMPTY (5923; 57%).
ADJ
tokens may have the following values of Animacy
:
Anim
(1019; 10% of non-emptyAnimacy
): которых, одного, которого, самого, других, многих, другого, всех, самих, молодыхInan
(9433; 90% of non-emptyAnimacy
): которые, последние, один, который, новые, первый, другие, новый, первые, разныеEMPTY
(103828): которые, который, один, которых, которая, других, нужно, которой, одной, другой
Paradigm КОТОРЫЙ | Anim | Inan |
---|---|---|
Gender=Masc|Number=Sing | которого | который |
Gender=Neut|Number=Sing | которые | |
Number=Plur | которых | которые |
Animacy
seems to be lexical feature of ADJ
. 91% lemmas (2316) occur only with one value of Animacy
.
VERB
1291 ru-pos/VERB tokens (1% of all VERB
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which VERB
and Animacy
co-occurred: Mood=EMPTY (1291; 100%), VerbForm=Part (1291; 100%), Case=Acc (1291; 100%), Person=EMPTY (1291; 100%), Number=Plur (778; 60%), Gender=EMPTY (778; 60%), Tense=Past (718; 56%), Voice=Act (668; 52%), Aspect=Perf (652; 51%).
VERB
tokens may have the following values of Animacy
:
Anim
(214; 17% of non-emptyAnimacy
): желающих, имеющих, спящего, задержанных, находящегося, пользующегося, похищенного, прибывающих, пытавшихся, сидящихInan
(1077; 83% of non-emptyAnimacy
): называемые, полученные, называемый, существующий, возникающие, идущие, направленные, имеющиеся, написанный, поставленныеEMPTY
(116001): может, есть, нет, могут, было, является, стал, сказал, быть, говорит
Paradigm ПОЛУЧАТЬ | Anim | Inan |
---|---|---|
Aspect=Imp|Number=Plur|Tense=Pres|Voice=Pass | получаемые | |
Aspect=Perf|Gender=Masc|Number=Sing|Tense=Past|Voice=Act | получившего | |
Aspect=Perf|Gender=Masc|Number=Sing|Tense=Past|Voice=Pass | полученный | |
Aspect=Perf|Number=Plur|Tense=Past|Voice=Act | получивших | получившие |
Aspect=Perf|Number=Plur|Tense=Past|Voice=Pass | полученные |
Animacy
seems to be lexical feature of VERB
. 91% lemmas (623) occur only with one value of Animacy
.
NUM
1187 ru-pos/NUM tokens (9% of all NUM
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which NUM
and Animacy
co-occurred: Case=Acc (1187; 100%).
NUM
tokens may have the following values of Animacy
:
Anim
(52; 4% of non-emptyAnimacy
): двух, троих, трех, двоих, нескольких, обоих, четверых, шестерых, семерых, четырехInan
(1135; 96% of non-emptyAnimacy
): несколько, два, три, две, четыре, обе, оба, двое, трое, четвероEMPTY
(12093): 1, 10, двух, 20, 2, два, 15, 5, 3, 30
Paradigm ДВА | Anim | Inan |
---|---|---|
Gender=Masc | двух | два |
Gender=Fem | двух | две |
Relations with Agreement in Animacy
The 10 most frequent relations where parent and child node agree in Animacy
:
NOUN –[nmod]–> NOUN (43488; 81%),
NOUN –[dobj]–> NOUN (23498; 79%),
NOUN –[conj]–> NOUN (20303; 95%),
NOUN –[appos]–> NOUN (6780; 94%),
NOUN –[name]–> NOUN (5021; 100%),
NOUN –[nsubj]–> NOUN (4382; 90%),
NOUN –[parataxis]–> NOUN (2735; 84%),
NOUN –[nummod:gov]–> NOUN (627; 79%),
NOUN –[advmod]–> NOUN (557; 85%),
NOUN –[cop]–> NOUN (485; 92%).
Animacy in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]