DET
: determiner
This document is a placeholder for the language-specific documentation
for DET
.
Treebank Statistics (UD_Persian)
There are 1 DET
lemmas (3%), 35 DET
types (0%) and 3558 DET
tokens (2%).
Out of 15 observed tags, the rank of DET
is: 11 in number of lemmas, 11 in number of types and 10 in number of tokens.
The 10 most frequent DET
lemmas: _
The 10 most frequent DET
types: این، آن، هر، همان، همین، برخی، تمام، تمامی، دیگر، همهٔ
The 10 most frequent ambiguous lemmas: _ (NOUN 57224, VERB 16929, ADJ 13490, PUNCT 13442, ADP 11406, PRON 5792, ADV 4099, DET 3558, NUM 3409, SCONJ 2428, CONJ 2098, AUX 742, PART 490, X 245, INTJ 69)
The 10 most frequent ambiguous types: این (DET 2370, PRON 489, CONJ 1), آن (PRON 591, DET 366, NOUN 3), همان (DET 128, PRON 8, NOUN 1), همین (DET 119, PRON 18), برخی (DET 43, PRON 41), تمام (DET 42, ADJ 38, PRON 1), دیگر (ADJ 204, ADV 39, DET 21, PRON 1), همهٔ (DET 20, PRON 15), بعضی (PRON 65, DET 19), سراسر (DET 17, ADV 1)
- این
- آن
- PRON 591: اگر این بحرانسازی کار یک اقلیت کوچک است چرا اکثریت در مقابل آن ساکت ند ؟
- DET 366: هرگاه او را یاد میکنم ، بر آن محبت و دوستی افزوده میشود .
- NOUN 3: فیلم “ تنها با زمین “ پیش از این نشان ویژه جشنواره فیلمهای کوتاه شهر گراتس اتریش را از آن خود کرد و در بخش مسابقه جشنواره فیلمهای کوتاه آسپن در ایالت کلورادو آمریکا به نمایش در آمد .
- همان
- همین
- برخی
- تمام
- دیگر
- ADJ 204: طرح دیگر شامل پرتاب فضاپیمایی است که در مدار مریخ قرار خواهد گرفت .
- ADV 39: میگویند مردگان دیگر دم بر نمیآورند و دیگر دهانی و صدایی ندارند .
- DET 21: از دیگر خلقیات حکومتی او این بود که عهدنگهدار بود .
- PRON 1: هماکنون همه خردمندان ما ، همه صوفیهای ما ، ویون ، رونسار ، لافونتین ، شنیه ، بودلر ، ورلن ، نروال ، موسه ، لامارتین و هوگو و چندین هزار دیگر از اینان ، دستهجمعی در درخشندگی ماه سیمگون زمزمه ستاینده و پرشکوهی ، خوشآهنگتر از صدای بر هم خوردن بال فرشتگان و یا ترانههای خنیاگران بهشتی ، برای تجلیل از خاطره تابناک حافظ و خیام و سعدی و جمع بیشمار دیگر ، عطار ، ابو سعید و غزالی و نغمهپردازان شیراز و اصفهان ، آغاز کردهاند .
- همهٔ
- بعضی
- سراسر
Morphology
The form / lemma ratio of DET
is 35.000000 (the average of all parts of speech is 412.051282).
The 1st highest number of forms (35) was observed with the lemma “_”: آن, آنها, اون, این, اینهمه, اینگونه, برخی, بعض, بعضی, تعدادی, تمام, تمامی, تنها, تکتک, دان, دین, دیگر, سراسر, سری, فلان, هر, همان, همه, همهٔ, همچین, همین, هیچگونه, چنان, چنین, چگونه, کدام, کلیه, کلیهٔ, ین, یکیک.
DET
does not occur with any features.
Relations
DET
nodes are attached to their parents using 10 different relations: fa-dep/det (3468; 97% instances), fa-dep/det:predet (36; 1% instances), fa-dep/mark (18; 1% instances), fa-dep/nsubj (15; 0% instances), fa-dep/advmod (6; 0% instances), fa-dep/dobj (6; 0% instances), fa-dep/nmod:poss (5; 0% instances), fa-dep/mwe (2; 0% instances), fa-dep/conj (1; 0% instances), fa-dep/parataxis (1; 0% instances)
Parents of DET
nodes belong to 9 different parts of speech: NOUN (3437; 97% instances), VERB (27; 1% instances), ADJ (26; 1% instances), ADV (23; 1% instances), NUM (22; 1% instances), PRON (20; 1% instances), ADP (1; 0% instances), CONJ (1; 0% instances), DET (1; 0% instances)
3510 (99%) DET
nodes are leaves.
46 (1%) DET
nodes have one child.
1 (0%) DET
nodes have two children.
1 (0%) DET
nodes have three or more children.
The highest child degree of a DET
node is 3.
Children of DET
nodes are attached using 10 different relations: fa-dep/mwe (22; 43% instances), fa-dep/nummod (13; 25% instances), fa-dep/case (5; 10% instances), fa-dep/nmod:poss (5; 10% instances), fa-dep/acl:relcl (1; 2% instances), fa-dep/amod (1; 2% instances), fa-dep/aux (1; 2% instances), fa-dep/ccomp (1; 2% instances), fa-dep/det (1; 2% instances), fa-dep/nsubj (1; 2% instances)
Children of DET
nodes belong to 8 different parts of speech: NOUN (21; 41% instances), NUM (14; 27% instances), PART (5; 10% instances), ADJ (3; 6% instances), CONJ (3; 6% instances), VERB (3; 6% instances), ADP (1; 2% instances), DET (1; 2% instances)
DET in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fi] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]