Upload 15 files

Browse files

Files changed (16) hide show

.gitattributes +3 -0
id_dep_web_sm/config.cfg +169 -0
id_dep_web_sm/meta.json +106 -0
id_dep_web_sm/parser/cfg +13 -0
id_dep_web_sm/parser/model +3 -0
id_dep_web_sm/parser/moves +1 -0
id_dep_web_sm/tagger/cfg +24 -0
id_dep_web_sm/tagger/model +3 -0
id_dep_web_sm/tok2vec/cfg +3 -0
id_dep_web_sm/tok2vec/model +3 -0
id_dep_web_sm/tokenizer +0 -0
id_dep_web_sm/vocab/key2row +1 -0
id_dep_web_sm/vocab/lookups.bin +3 -0
id_dep_web_sm/vocab/strings.json +0 -0
id_dep_web_sm/vocab/vectors +0 -0
id_dep_web_sm/vocab/vectors.cfg +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,6 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+id_dep_web_sm/parser/model filter=lfs diff=lfs merge=lfs -text
+id_dep_web_sm/tagger/model filter=lfs diff=lfs merge=lfs -text
+id_dep_web_sm/tok2vec/model filter=lfs diff=lfs merge=lfs -text

id_dep_web_sm/config.cfg ADDED Viewed

	@@ -0,0 +1,169 @@

+[paths]
+train = null
+dev = null
+vectors = null
+init_tok2vec = null
+[system]
+seed = 0
+gpu_allocator = null
+[nlp]
+lang = "id"
+pipeline = ["tok2vec","parser","tagger"]
+disabled = []
+before_creation = null
+after_creation = null
+after_pipeline_creation = null
+batch_size = 1000
+tokenizer = {"@tokenizers":"spacy.Tokenizer.v1"}
+vectors = {"@vectors":"spacy.Vectors.v1"}
+[components]
+[components.parser]
+factory = "parser"
+learn_tokens = false
+min_action_freq = 30
+moves = null
+scorer = {"@scorers":"spacy.parser_scorer.v1"}
+update_with_oracle_cut_size = 100
+[components.parser.model]
+@architectures = "spacy.TransitionBasedParser.v2"
+state_type = "parser"
+extra_state_tokens = false
+hidden_width = 64
+maxout_pieces = 2
+use_upper = true
+nO = null
+[components.parser.model.tok2vec]
+@architectures = "spacy.HashEmbedCNN.v2"
+pretrained_vectors = null
+width = 96
+depth = 4
+embed_size = 2000
+window_size = 1
+maxout_pieces = 3
+subword_features = true
+[components.tagger]
+factory = "tagger"
+label_smoothing = 0.0
+neg_prefix = "!"
+overwrite = false
+scorer = {"@scorers":"spacy.tagger_scorer.v1"}
+[components.tagger.model]
+@architectures = "spacy.Tagger.v2"
+nO = null
+normalize = false
+[components.tagger.model.tok2vec]
+@architectures = "spacy.HashEmbedCNN.v2"
+pretrained_vectors = null
+width = 96
+depth = 4
+embed_size = 2000
+window_size = 1
+maxout_pieces = 3
+subword_features = true
+[components.tok2vec]
+factory = "tok2vec"
+[components.tok2vec.model]
+@architectures = "spacy.HashEmbedCNN.v2"
+pretrained_vectors = null
+width = 96
+depth = 4
+embed_size = 2000
+window_size = 1
+maxout_pieces = 3
+subword_features = true
+[corpora]
+[corpora.dev]
+@readers = "spacy.Corpus.v1"
+path = ${paths.dev}
+gold_preproc = false
+max_length = 0
+limit = 0
+augmenter = null
+[corpora.train]
+@readers = "spacy.Corpus.v1"
+path = ${paths.train}
+gold_preproc = false
+max_length = 0
+limit = 0
+augmenter = null
+[training]
+seed = ${system.seed}
+gpu_allocator = ${system.gpu_allocator}
+dropout = 0.1
+accumulate_gradient = 1
+patience = 1600
+max_epochs = 0
+max_steps = 20000
+eval_frequency = 200
+frozen_components = []
+annotating_components = []
+dev_corpus = "corpora.dev"
+train_corpus = "corpora.train"
+before_to_disk = null
+before_update = null
+[training.batcher]
+@batchers = "spacy.batch_by_words.v1"
+discard_oversize = false
+tolerance = 0.2
+get_length = null
+[training.batcher.size]
+@schedules = "compounding.v1"
+start = 100
+stop = 1000
+compound = 1.001
+t = 0.0
+[training.logger]
+@loggers = "spacy.ConsoleLogger.v1"
+progress_bar = false
+[training.optimizer]
+@optimizers = "Adam.v1"
+beta1 = 0.9
+beta2 = 0.999
+L2_is_weight_decay = true
+L2 = 0.01
+grad_clip = 1.0
+use_averages = false
+eps = 0.00000001
+learn_rate = 0.001
+[training.score_weights]
+dep_uas = 0.25
+dep_las = 0.25
+dep_las_per_type = null
+sents_p = null
+sents_r = null
+sents_f = 0.0
+tag_acc = 0.5
+[pretraining]
+[initialize]
+vectors = ${paths.vectors}
+init_tok2vec = ${paths.init_tok2vec}
+vocab_data = null
+lookups = null
+before_init = null
+after_init = null
+[initialize.components]
+[initialize.tokenizer]

id_dep_web_sm/meta.json ADDED Viewed

	@@ -0,0 +1,106 @@

+{
+  "lang":"id",
+  "name":"pipeline",
+  "version":"0.0.0",
+  "spacy_version":">=3.8.3,<3.9.0",
+  "description":"",
+  "author":"",
+  "email":"",
+  "url":"",
+  "license":"",
+  "spacy_git_version":"be0fa81",
+  "vectors":{
+    "width":0,
+    "vectors":0,
+    "keys":0,
+    "name":null,
+    "mode":"default"
+  },
+  "labels":{
+    "tok2vec":[
+    ],
+    "parser":[
+      "ROOT",
+      "acl",
+      "acl:relcl",
+      "advcl",
+      "advmod",
+      "advmod:emph",
+      "amod",
+      "appos",
+      "aux",
+      "case",
+      "case:adv",
+      "cc",
+      "cc:preconj",
+      "ccomp",
+      "clf",
+      "compound",
+      "compound:a",
+      "conj",
+      "cop",
+      "csubj",
+      "csubj:pass",
+      "dep",
+      "det",
+      "discourse",
+      "fixed",
+      "flat",
+      "flat:foreign",
+      "flat:name",
+      "goeswith",
+      "iobj",
+      "list",
+      "mark",
+      "nmod",
+      "nmod:lmod",
+      "nmod:poss",
+      "nmod:tmod",
+      "nsubj",
+      "nsubj:pass",
+      "nummod",
+      "obj",
+      "obl",
+      "obl:agent",
+      "obl:tmod",
+      "orphan",
+      "parataxis",
+      "punct",
+      "vocative",
+      "xcomp"
+    ],
+    "tagger":[
+      "PROPN",
+      "AUX",
+      "DET",
+      "NOUN",
+      "PRON",
+      "VERB",
+      "ADP",
+      "PUNCT",
+      "ADV",
+      "CCONJ",
+      "SCONJ",
+      "NUM",
+      "ADJ",
+      "PART",
+      "SYM",
+      "INTJ",
+      "X"
+    ]
+  },
+  "pipeline":[
+    "tok2vec",
+    "parser",
+    "tagger"
+  ],
+  "components":[
+    "tok2vec",
+    "parser",
+    "tagger"
+  ],
+  "disabled":[
+  ]
+}

id_dep_web_sm/parser/cfg ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "moves":null,
+  "update_with_oracle_cut_size":100,
+  "multitasks":[
+  ],
+  "min_action_freq":30,
+  "learn_tokens":false,
+  "beam_width":1,
+  "beam_density":0.0,
+  "beam_update_prob":0.0,
+  "incorrect_spans_key":null
+}

id_dep_web_sm/parser/model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5d0d9591e65e456f4416183abafe94ceb8a38f3343c9f22ae755f30a82566f60
+size 4060164

id_dep_web_sm/parser/moves ADDED Viewed

	@@ -0,0 +1 @@

+ ��moves�E{"0":{"nsubj":-2,"cop":-3,"det":-4,"ROOT":-5,"nsubj:pass":-6,"acl:relcl":-7,"case":-8,"obl":-9,"nmod":-10,"punct":-11,"appos":-12,"amod":-13,"compound":-14,"advmod":-15,"cc":-16,"mark":-17,"acl":-18,"obj":-19,"conj":-20,"nmod:poss":-21,"advcl":-22,"flat:name":-23,"nmod:tmod":-24,"nummod":-25,"aux":-26,"dep":-27,"xcomp":-28,"advmod:emph":-29,"ccomp":-30,"parataxis":-31,"obl:tmod":-32,"clf":-33,"flat":-34,"fixed":-35,"discourse":-36,"vocative":-37,"obl:agent":-38,"case:adv":-39,"nmod:lmod":-40,"compound:a":-41,"goeswith":-42,"orphan":-43,"csubj":-44,"iobj":-45,"list":-46,"csubj:pass":-47,"cc:preconj":-48,"flat:foreign":-49},"1":{"nsubj":-2,"cop":-3,"det":-4,"ROOT":-5,"nsubj:pass":-6,"acl:relcl":-7,"case":-8,"obl":-9,"nmod":-10,"punct":-11,"appos":-12,"amod":-13,"compound":-14,"advmod":-15,"cc":-16,"mark":-17,"acl":-18,"obj":-19,"conj":-20,"nmod:poss":-21,"advcl":-22,"flat:name":-23,"nmod:tmod":-24,"nummod":-25,"aux":-26,"dep":-27,"xcomp":-28,"advmod:emph":-29,"ccomp":-30,"parataxis":-31,"obl:tmod":-32,"clf":-33,"flat":-34,"fixed":-35,"discourse":-36,"vocative":-37,"obl:agent":-38,"case:adv":-39,"nmod:lmod":-40,"compound:a":-41,"goeswith":-42,"orphan":-43,"csubj":-44,"iobj":-45,"list":-46,"csubj:pass":-47,"cc:preconj":-48,"flat:foreign":-49},"2":{"dep":0,"nsubj":-2,"cop":-3,"det":-4,"ROOT":-5,"nsubj:pass":-6,"acl:relcl":-7,"case":-8,"obl":-9,"nmod":-10,"punct":-11,"appos":-12,"amod":-13,"compound":-14,"advmod":-15,"cc":-16,"mark":-17,"acl":-18,"obj":-19,"conj":-20,"nmod:poss":-21,"advcl":-22,"flat:name":-23,"nmod:tmod":-24,"nummod":-25,"aux":-26,"xcomp":-28,"advmod:emph":-29,"ccomp":-30,"parataxis":-31,"obl:tmod":-32,"clf":-33,"flat":-34,"fixed":-35,"discourse":-36,"vocative":-37,"obl:agent":-38,"case:adv":-39,"nmod:lmod":-40,"compound:a":-41,"goeswith":-42,"orphan":-43,"csubj":-44,"iobj":-45,"list":-46,"csubj:pass":-47,"cc:preconj":-48,"flat:foreign":-49},"3":{"dep":0,"nsubj":-2,"cop":-3,"det":-4,"ROOT":-5,"nsubj:pass":-6,"acl:relcl":-7,"case":-8,"obl":-9,"nmod":-10,"punct":-11,"appos":-12,"amod":-13,"compound":-14,"advmod":-15,"cc":-16,"mark":-17,"acl":-18,"obj":-19,"conj":-20,"nmod:poss":-21,"advcl":-22,"flat:name":-23,"nmod:tmod":-24,"nummod":-25,"aux":-26,"xcomp":-28,"advmod:emph":-29,"ccomp":-30,"parataxis":-31,"obl:tmod":-32,"clf":-33,"flat":-34,"fixed":-35,"discourse":-36,"vocative":-37,"obl:agent":-38,"case:adv":-39,"nmod:lmod":-40,"compound:a":-41,"goeswith":-42,"orphan":-43,"csubj":-44,"iobj":-45,"list":-46,"csubj:pass":-47,"cc:preconj":-48,"flat:foreign":-49},"4":{"ROOT":0,"nsubj":-2,"cop":-3,"det":-4,"nsubj:pass":-6,"acl:relcl":-7,"case":-8,"obl":-9,"nmod":-10,"punct":-11,"appos":-12,"amod":-13,"compound":-14,"advmod":-15,"cc":-16,"mark":-17,"acl":-18,"obj":-19,"conj":-20,"nmod:poss":-21,"advcl":-22,"flat:name":-23,"nmod:tmod":-24,"nummod":-25,"aux":-26,"dep":-27,"xcomp":-28,"advmod:emph":-29,"ccomp":-30,"parataxis":-31,"obl:tmod":-32,"clf":-33,"flat":-34,"fixed":-35,"discourse":-36,"vocative":-37,"obl:agent":-38,"case:adv":-39,"nmod:lmod":-40,"compound:a":-41,"goeswith":-42,"orphan":-43,"csubj":-44,"iobj":-45,"list":-46,"csubj:pass":-47,"cc:preconj":-48,"flat:foreign":-49}}�cfg��neg_key�

id_dep_web_sm/tagger/cfg ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "label_smoothing":0.0,
+  "labels":[
+    "PROPN",
+    "AUX",
+    "DET",
+    "NOUN",
+    "PRON",
+    "VERB",
+    "ADP",
+    "PUNCT",
+    "ADV",
+    "CCONJ",
+    "SCONJ",
+    "NUM",
+    "ADJ",
+    "PART",
+    "SYM",
+    "INTJ",
+    "X"
+  ],
+  "neg_prefix":"!",
+  "overwrite":false
+}

id_dep_web_sm/tagger/model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:574edacde8d90c2a76babadc1257b0fd347155ad0a3079f90cd1509d9b388b68
+size 3712437

id_dep_web_sm/tok2vec/cfg ADDED Viewed

	@@ -0,0 +1,3 @@


1	+ {
2	+
3	+ }

id_dep_web_sm/tok2vec/model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b8459bda201c5daf60072489266a53b70f5c3a0b6bdfd3fab5d622a443b8754b
+size 3705091

id_dep_web_sm/tokenizer ADDED Viewed

The diff for this file is too large to render. See raw diff

id_dep_web_sm/vocab/key2row ADDED Viewed

	@@ -0,0 +1 @@


1	+ �

id_dep_web_sm/vocab/lookups.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:76be8b528d0075f7aae98d6fa57a6d3c83ae480a8469e668d7b0af968995ac71
+size 1

id_dep_web_sm/vocab/strings.json ADDED Viewed

The diff for this file is too large to render. See raw diff

id_dep_web_sm/vocab/vectors ADDED Viewed

Binary file (128 Bytes). View file

id_dep_web_sm/vocab/vectors.cfg ADDED Viewed

	@@ -0,0 +1,3 @@

+{
+  "mode":"default"
+}