File size: 34,673 Bytes
9c914a0 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 |
---
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:482743
- loss:CachedMultipleNegativesRankingLoss
base_model: BAAI/bge-m3
widget:
- source_sentence: 언제 청년층 생산가능인구 수가 9,149,000명으로 드러났어
sentences:
- '제2장 청년층 노동시장 동향 및 청년내일채움공제의 성과 개괄
□ 본 장에서는 청년내일채움공제 사업의 도입 배경으로 작용한 청년층 노동시장의 현황을 살펴보고, 세부 성과에 앞서 청년내일채움공제가 현 청년고용
실태에 미친 개괄적 성과를 평가하고자 한다
제1절 청년층 노동시장 동향
1. 청년층 인구구조 변화 추이
□ 고용률과 실업률, 취업자 수 등의 고용지표는 경제 및 노동시장의 상황 뿐 만 아니라, 인구구조 변화에 의해 영향을 받는 만큼, 청년층의
노동시장 동향을 파악하기 위해서는 청년층 인구구조의 변화양상을 이해할 필요가 있음 □ 청년층 인구구조 변화 추이
○ 전체 생산가능인구가 여전히 증가추세에 있는 것에 비해, 청년층(15∼29세) 생산가능인구는 1990년을 기점으로 감소추세에 있음. 2018년
청년층 생산가능인구는 전년대비 133천명 감소한 9,149천명임 - 15∼19세, 20∼24세 연령대의 생산가능인구는 감소추세에 있으나, 25∼29세
생산가능인구(3,432천명, 전년대비 96천명 증가)는 증가추세에 있으며 향후 2∼3년간 증가추세가 지속될 것으로 전망됨
○ 청년층 경제활동인구는 2000년대 지속적으로 감소하다가 2013∼2016년 기간 증가추세를 보였으나, 2017년 이후 감소하고 있음. 2018년
청년층 경제활동인구는 전년대비 21천명 감소한 4,312천명을 기록하였음'
- 2. 인구구조변화의 현황<br>UN 인구국 자료를 분석해보면 2010년 인구와 2050년의 중간 수준 예측치를 기준으로 인구 1,000만 명
이상의 국가이면서 2050년까지 생산가능인구(15세~64세)가 감소하는 국가는 198개국중에서 19개국이다. 이 중에서 우리나라는 생산 가능인구(15세~64세)
감소율이 세계 6위 수준을 기록할 것으로 분석되었고, 이에 따라 생산가능 인구가 2010년 대비 2050년에는 27%가 줄어들 것으로 예상된다.
이에 반하여 노인인구는 236%가 증가할 것으로 예상된다. 우리나라는 생산가능인구 감소율과 노인인구(65세 이상) 증가율이 매우 높은 나라
중 하나이며, 동시에 유소년(0~14세) 인구의 감소도 22% 정도 될 것으로 예상하고 있다. <br>UN의 인구국(局) 자료인 [표 1]을
보면, 첫째 현재 우리나라를 포함하여 선진국에서조차도 현재 인구감소를 겪어본 국가가 거의 없어 이것이 가져다 줄 영향에 대한 경험적 지식이
거의 전무하다는 점이다. <br>둘째, 우리나라의 경우에는 무엇보다도 인구감소기로의 전환이 급격하게 이루어지고 있다. 따라서 우리 스스로 이의
긍정적ㆍ부정적 영향을 연역적으로 추론해볼 필요가 있다. 이를 위해서는 우리 사회의 전체 변화를 거시적으로 바라보고 정책 수단에 따라 가져다
줄 다양한 변화를 살펴볼 수 있는 시뮬레이션(simulation) 도구 및 정책 개발 그리고 집행 체제가 필요하다고 할 수 있다.
- '7. 해외사례
플랫폼 노동관계에 특화된 산재보험제도를 별도로 규정하고 있는 포괄적 입법례는 아직 보이지 않는다. 다만, 플랫폼 노동에 관한 미국의 앨라배마
주법(SB363, 2018.3.13. 제정)에서는 플랫폼 노동자들에게 일정한 수준의 복지를 허용하기 위한 법적 기초를 만들고 있다(부표 1
참조). SB363은 플랫폼 노동자들의 이동성을 고려한 ‘이동 가능 복지제도’(portable benefit plans)를 플랫폼 사업주들이
만들면, 이 복지제도를 통해 다수의 플랫폼과 계약을 맺는 플랫폼 노동자들이 복수 사업주 혹은 사업주의 변경에도 불구하고 복지제도를 유지하면서
그로부터 복지수혜를 얻을 수 있도록 하고 있다. 이때의 복지제도는 건강보험, 재해보험, 퇴직수당제도 등으로 구성될 수 있고, 플랫폼 노동자가
복지계좌를 개설하면 여기에 플랫폼 사업주가 복지기여금을 납부하는 방식을 취하고 있다. 국가에 의한 사회보험제도가 아니고, 플랫폼 사업주에 의한
자발적 복지제도의 기초를 구성한 것이기는 하지만, 지방정부가 이를 관리하도록 함으로써 공정성과 객관성을 담보한다. 한국의 산재보험제도에 대입시켜
비교할 수 있는 입법례가 아니기는 하지만, 플랫폼 사업주로 하여금 플랫폼 노동자에 대한 일정한 복지제도 형성을 촉구하고 있다는 점, 해당 복지제도에
대하여 플랫폼이 일정한 기여금을 납부하도록 하고 있다는 점 등에서 하나의 제도적 모델로 시사가능하다. 한편, 미국의 플로리다, 인디아나, 아이오와,
켄터키, 테네시, 텍사스, 유타주 등에서는 플랫폼노동자(경우에 따라서는 가사노동자에 국한)의 의미를 규정하면서, 주법상 재해보험제도 및(또는)
실업급여제도의 가입자가 될 수 있도록 하고 있다.'
- source_sentence: 도매 전력 매매를 주로 한 전력거래체계를 만들었을 때 어느 부문이 안정성 영향을 받을 수 있어
sentences:
- '(4) 외환시장
원/달러 환율 2016년 말 대비 하락
원/달러 환율은 연초 미 보호무역주의에 대한 우려, 수출 호조, 외국인 증권투자자금 유입 등으로 3월 말까지 상당 폭 하락하였다. 이후 북한
관련 리스크 전개 상황, 미 연준의 연내 금리인상 기대 변화 등에 따라 등락하는 모습을 보였다. 10월 들어 북한 리스크 완화, 미 달러화
약세 지속, 국내경제의 견실한 성장세 등으로 하락세로 전환하였으며, 2017년 말에는 연중 최저치인 1,070.5원을 기록하였다. 2017년
중 미 달러화에 대한 원화의 가치는 2016년 말 대비 12.8% 상승하였다. 한편 원/엔 환율(100엔당)은 미 연준 금리인상 기대변화,
북한 리스크 등에 영향을 받으며 등락을 지속하다가 10월 들어 원화가 상대적으로 강세를 보이면서 하락하였다. 2017년 말 원화의 엔화에 대한
가치는 100엔당 949.2원으로 2016년 말 대비 9.1% 상승하였다. 원/달러 환율의 일중 및 전일대비 변동폭은 연평균 각각 5.5원,
4.4원을 기록하여 2016년(각각 7.5원 및 6.0원)에 비해 축소되었다. 외환스왑레이트 하락, 통화스왑금리 상승
외환스왑레이트(3개월물)는 외화자금수요 확대 등으로 2016년 말 대비 0.61% 포인트 하락한 -0.63%를 기록하였다. 통화스왑금리(3년물)는
경제지표 호조 등에 따른 국고채 금리 상승 등으로 2016년 말 대비 0.37% 포인트 상승한 1.57%를 기록하였다.'
- '4. 국내 전력거래 형태 전망
앞서 살펴보았듯이, 구조개편을 단행한 외국의 전력거래 형태는 대체로 도매 전력거래 위주, 소매 전력거래 위주, 계약위주 등 세 가지로 구분되어
있다. 국내 전력산업의 현재 여건을 고려할 경우 가장 가능성이 높은 전력거래 형태는 도매 전력거래 위주의 거래형태일 것이다. 만약 도매 전력거래
위주의 전력거래체계를 구축하는 경우 가격과 공급의 안정성에 상당한 영향을 미칠 것으로 보인다. 하지만 규제계약(Vesting Contract)을
포함하여 장단기 계약물량을 확대함으로써 현물시장의 가격 및 공급 변동성을 완화할 수 있는 대안이 존재한다. 만약 전력시장에서의 가격과 공급
안정성 측면을 염두에 둔다면 소매 전력거래 형태 또는 장단기 계약 위주의 전력거래 형태를 고려해 볼 수 있다. 소매 전력거래 형태에서는 주로
기존의 수직통합체제 또는 이미 발전과 판매가 송배전 부문으로부터 분리된 경우라면 발전과 판매의 통합과 이로 인한 규모의 확대에 따라 유효경쟁의
약화 가능성이 문제가 될 수 있다. 이렇게 통합된 기업의 소매시장에서의 시장지배력 문제가 존재하기 때문에 순수 판매회사 또는 신규기업과의 실질적인
경쟁이 가능한 방향으로 제도적 장치를 마련할 필요가 있다.'
- 'Ⅲ. 우리나라 전력시장에서의 유연성 자원
1. 우리나라 전력시장의 현황
우리나라의 전력시장은 전력산업의 효율성 향상을 위하여 2001년 전력산업구조개편을 통해 독점사업자였던 한국전력공사로부터 발전부문을 분리시켜
발전자회사로 재편시키고, 발전부문에 대한 경쟁체제를 도입하면서 출범하였다. 우리나라 전력시장은 소비자가 직접 거래에 참여하는 소매시장이 아닌
발전회사와 판매회사가 참여하는 도매시장으로, 다수의 발전회사가 존재하는 공급측과는 달리 수요측은 단일 구매자인 한국전력공사만 존재하는 구매독점
형태로 이루어져 있다. 또한 설비용량이 20MW를 초과하는 상업용 발전기는 전력시장을 통해서만 거래가 가능한 의무적 시장이다.'
- source_sentence: 해외 파생상품시장에서 거래되는 경우는 어떤 파생상품으로 분류할 수 있어
sentences:
- '3) 연금 세제
▩ 근퇴법 상 연금수령을 활성화하기 위한 강제조항이 부재한 상황에서 세제체계(소득세법)에 따라 수령방법이 결정되는 구조임. ○ 제도적으로 일시금
수령을 방지하거나 연금수령을 강제하는 규정이 부재한 상황에서 수령 방법은 주로 세금부담에 따라 결정될 수밖에 없음. ○ 일시금 수령을 경감시키기
위해 2016년 소득세법을 개정하였으나 개정된 소득세법 조차도 일시금과 연금수령 간 세금부담 차이가 크지 않아 일시금 수령을 방지하지 못하는
한계가 존재함. ▩ 연금과 일시금 수령 간 세제차이가 크지 않은 주요 원인은 일시금 수령시 제공하는 공제혜택이 크기 때문임. ○ 국내 퇴직연금시장에서
일시금 수령이 만연한 것은 연금수령 시 부담하는 세율이 높아서가 아니라 일시금 수령 시 부담하는 세율이 낮기 때문임. ○ 일시금 수령의 세금부담이
높지 않은 이유는 일시금 수령 시에도 다수의 공제혜택(근속연수공제+환산급여공제)이 제공되고 혜택의 규모도 크기 때문임. ○ 즉 연금수령 시에는
일시금 수령 시 부담하는 세금의 70%만을 부담하도록 규정하고(소득세법 제129조(원천징수세율)제1항제5의336)) 있으나, 일시금 수령 시
세금부담이 작기 때문에 연금수령 시 추가 제공되는 세제혜택의 크기가 미미하게 됨. ○ 특히 연금수령 기간에 따른 세금차이가 없어 연금으로 수령하더라도
단기간 연금(예, 10년)을 수령하는 유인을 제공함.'
- □ 장외파생 권역별 대표 상품을 살펴보면 금리관련상품 중에는 금리스왑(Interest Rate Swap:IRS)이, 통화관련 상품 중에서는
통화선도계약이, 신용관련거래에서는 신용파산스왑(Credit Default Swap:CDS)이 가장 높은 비중을 차지<br>○ 금리스왑은 금리관련
장외파생상품시장의 91.2%를 차지하고 있으며, 신용관련상품의 경우 신용파산스왑과 총수익스왑(Total Return Swap:TRS)만이 거래<br>○
통화선도는 대부분 NDF(Non-Deliverable Forward)의 형태로 거래<br>○ 장외파생상품 거래는 일대일 계약을 기반으로 하고
거래당사자의 높은 신용도를 요구하기 때문에 신용도가 낮은 개인 또는 금융기관은 참가하기가 어려운 실정<br>○ 특히, 신용관련거래는 다른 금융기관에
비해 상대적으로 높은 신용도를 가지고 있는 은행과 증권사를 통해서만 거래가 이루어지고 있는 것으로 파악
- '제5조 (파생상품) ① 이 법에서 ˝파생상품˝이란 다음 각 호의 어느 하나에 해당하는 계약상의 권리를 말한다.
1. 기초자산이나 기초자산의 가격ㆍ이자율ㆍ지표ㆍ단위 또는 이를 기초로 하는 지수 등에 의하여 산출된 금전등을 장래의 특정 시점에 인도할 것을
약정하는 계약
2. 당사자 어느 한쪽의 의사표시에 의하여 기초자산이나 기초자산의 가격ㆍ이자율ㆍ지표ㆍ단위 또는 이를 기초로 하는 지수 등에 의하여 산출된 금전등을
수수하는 거래를 성립시킬 수 있는 권리를 부여하는 것을 약정하는 계약
3. 장래의 일정기간 동안 미리 정한 가격으로 기초자산이나 기초자산의 가격ㆍ이자율ㆍ지표ㆍ단위 또는 이를 기초로 하는 지수 등에 의하여 산출된
금전등을 교환할 것을 약정하는 계약
② 이 법에서 ˝장내파생상품˝이란 파생상품으로서 파생상품시장에서 거래되는 것 또는 해외 파생상품시장(파생상품시장과 유사한 시장으로서 해외에
있는 시장과 대통령령으로 정하는 해외 파생상품거래가 이루어지는 시장을 말한다)에서 거래되는 것을 말한다. ③ 이 법에서 ˝장외파생상품˝이란
파생상품으로서 장내파생상품이 아닌 것을 말한다. ④ 제1항 각 호의 어느 하나에 해당하는 계약 중 매매계약이 아닌 계약의 체결은 이 법을 적용함에
있어서 매매계약의 체결로 본다.'
- source_sentence: 어디서 자금세탁 전제범죄에서 비영리단체 관련 자금세탁범죄를 찾아내는 방식을 선택했어
sentences:
- 'IV. 비영리단체 분야의 범죄유형 및 사례
1. 국내사례와 범죄유형
□ 한국은 아직 비영리단체에 대한 명확한 개념 구분이 정립되어 있지 않은 실정으로 이에 따라 그동안 한국에서는 비영리단체 관련범죄에 대한 인식이
제대로 이루어지지 않음. -비영리단체 관련 범죄에 있어서도 비영리단체에 대한 명확한 개념 구분 없이 판결문이 작성되어 비영리단체 관련 자금세탁범죄를
조사하는데 있어서 큰 장애로 작용함. -국내 판례에서 비영리단체와 관련하여 자금세탁이라는 용어를 직접 사용한 경우는 없으며 이에 따라 부득이
자금세탁 전제범죄를 통하여 비영리단체 관련 자금세탁범죄를 조사하는 방법을 택함.'
- 'VI. 비영리단체를 통한 테러자금조달방지를 위한 제도개선방안
□ FATF는 2001년 10월 테러자금조달에 대한 특별권고 8항(Special Recommendationson Terrorist Financing)을
통하여 비영리단체에 대한 관리감독을 강화하고 관련 법규를 정비할 것을 권고하였음. -우리나라에서 비영리단체를 통한 자금세탁을 이용해서 테러자금이
조달될 가능성은 매우 낮은 것으로 평가되나 자금세탁의 우회로를 차단하고, 또한 예방적인 조치를 취해 국제적으로 자금세탁을 통한 불법적인 테러자금조달
방지 노력에 적극 부응하기 위해서는 비영리단체에 대한 자금세탁 방지제도 도입에 적극 참여해야 할 것임.'
- '(2) 전북의 풍력산업 약점
전북의 풍력산업은 내부환경관점에서 다음과 같은 약점을 보유하고 있다. 첫째, 두산(창원), 유니슨(사천), 효성(창원), 한진(양산) 등 풍력터빈시스템업체는
모두 경남권에 위치하고 있으며, 현재 경남 이외 지역에서는 MW급 이상 풍력용 터빈시스템업체가 존재하지 않는다. 다만 최근 터빈의 대형화에
따라, 터빈의 무게 및 부피 등에 따른 운송에 한계가 존재하고 상당기간 고정식 형태의 해상풍력발전단지 구축이 중심이 될 것으로 판단됨에 따라,
부유식 해상풍력단지개발이 시작되기 전까지는 GW급 해상풍력단지 개발계획에 따라 서해안권으로 시스템업체의 이전가능성은 일부 존재한다. 둘째,
해상풍력 관련 연구/생산인력 부족 역시 장기적 해상풍력기술의 지속성 관점에서 시급한 문제이다. 현재 전북은 해상풍력터빈과 관련된 기술은 없으나,
휴먼컴퍼지트와 재료연구원 풍력핵심기술연구센터를 통해 해상풍력 블레이드 및 재료 등에 대한 기술이 축적되어 있다. 이외에 하부구조물 및 타워
관련 기술 역시 에드벡트가 석션버켓(suction bucket)방식의 하부구조물 관련 기술을 보유하고 있고 현재 군산공장을 리모델링 중인 CS윈드는
세계 최고수준의 타워제작기술을 확보하고 있다. 따라서 전북은 블레이드, 재료, 타워 및 하부구조물 등과 관련된 기술을 확보하고 있다.'
- source_sentence: 전남지역의 석유와 화학제품은 왜 수출이 늘어나는 경향을 보였어
sentences:
- '수출 증가세 지속
1/4분기 중 수출은 전년동기대비 증가흐름을 지속하였다. 품목별로 보면 석유제품, 석유화학, 철강, 선박, 반도체, 자동차 등 대다수 품목에서
증가하였다. 석유제품은 글로벌 경기회복에 따른 에너지 수요 증가와 국제유가 급등으로 수출단가가 높은 상승세를 지속하면서 증가하였다. 석유화학도
중국, 아세안을 중심으로 합성수지, 고무 등의 수출이 큰 폭 증가한 데다 고유가로 인한 수출가격도 동반 상승하면서 증가세를 이어갔다. 철강은
건설, 조선 등 글로벌 전방산업의 수요 증대, 원자재가격 상승 및 중국 감산 등에 따른 수출단가 상승 등에 힘입어 증가세를 이어갔다. 선박은
1/4분기 중 인도물량이 확대됨에 따라 증가하였다. 반도체는 자동차 등 전방산업의 견조한 수요가 이어지는 가운데 전년동기대비로 높은 단가가
지속되면서 증가하였다. 자동차는 차량용 반도체 수급차질이 지속되었음에도 불구하고 글로벌 경기회복 흐름에 따라 수요가 늘어나면서 전년동기대비
소폭 증가하였다. 모니터링 결과 향후 수출은 증가세가 지속될 것으로 전망되었다. 석유화학 및 석유정제는 수출단가 상승과 전방산업의 수요확대
기조가 이어지면서 증가할 전망이다. 철강은 주요국 경기회복과 중국, 인도 등의 인프라 투자 확대 등으로 양호한 흐름을 이어갈 전망이다. 반도체는
글로벌 스마트폰 수요 회복, 디지털 전환 기조 등으로 견조한 증가세를 지속할 것으로 보인다. 자동차는 차량용 반도체 공급차질이 점차 완화되고
미국, 신흥시장을 중심으로 수요회복이 본격화됨에 따라 소폭 증가할 전망이다. 선박은 친환경 선박수요 지속, 글로별 교역 신장 등에도 불구하고
2021년 2/4분기 집중되었던 인도물량의 기저효과로 인해 감소할 것으로 보인다.'
- '(3) 금융기관 여수신
은행 수신 큰 폭 확대
은행 수신은 2019년에 비해 증가폭이 크게 확대되었다. 수시입출식예금은 불확실성 증대에 따른 가계 및 기업의 예비자금 확보 등의 영향으로
증가 규모가 전년대비 3배가량 확대되었다. 반면 정기예금은 예금금리 하락, 예대율 및 LCR 규제 완화에 따른 은행의 정기예금 유치 유인 축소
등에 기인하여 감소로 전환하였다. 자산운용사 수신은 증가폭이 축소되었다. MMF는 꾸준한 증가세를 유지하였으나 주식형 및 채권형 펀드는 개인투자자의
주식 직접투자증가, 신용증권에 대한 시장 경계감 확대 등으로 감소로 전환하였다. 또한 기타펀드는 2019년 중 일부 사모펀드 손실 및 환매중단
사태, 사모펀드 일반투자자 요건 강화 등으로 증가 규모가 절반 수준으로 축소되었다. 한편 신용협동기구 등 비은행예금취급기관 수신은 대체로 2019년과
비슷한 증가 규모를 나타내었다.'
- '(2) 전남지역
2013년중 전남지역 수출은 전년대비 1.2% 감소로 전환하였다. 품목별로는 석유(+9.3% → +3.8%) 및 화학제품(+1.2% → +7.1%)이
중국 등 해외수요확대로 증가세를 지속하였으나 철강금속(+1.8% → -8.6%)은 글로벌 공급과잉 및 중국의 저가 철강수출 확대로, 선박(+7.6%
→ -49.2%)은 수주물량이 급격히 줄어들면서 감소로 전환하였다. 전남지역 수입은 원유, 화학제품, 철강금속 등의 수입이 줄면서 전년대비
7.4% 감소로 전환하였다.'
pipeline_tag: sentence-similarity
library_name: sentence-transformers
---
# SentenceTransformer based on BAAI/bge-m3
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3) <!-- at revision 5617a9f61b028005a4858fdac845db406aefb181 -->
- **Maximum Sequence Length:** 1024 tokens
- **Output Dimensionality:** 1024 tokens
- **Similarity Function:** Cosine Similarity
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
SentenceTransformer(
(0): Transformer({'max_seq_length': 1024, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("seongil-dn/bge-m3-kor-retrieval-bs1024-checkpoint-59")
# Run inference
sentences = [
'전남지역의 석유와 화학제품은 왜 수출이 늘어나는 경향을 보였어',
'(2) 전남지역\n2013년중 전남지역 수출은 전년대비 1.2% 감소로 전환하였다. 품목별로는 석유(+9.3% → +3.8%) 및 화학제품(+1.2% → +7.1%)이 중국 등 해외수요확대로 증가세를 지속하였으나 철강금속(+1.8% → -8.6%)은 글로벌 공급과잉 및 중국의 저가 철강수출 확대로, 선박(+7.6% → -49.2%)은 수주물량이 급격히 줄어들면서 감소로 전환하였다. 전남지역 수입은 원유, 화학제품, 철강금속 등의 수입이 줄면서 전년대비 7.4% 감소로 전환하였다.',
'수출 증가세 지속\n1/4분기 중 수출은 전년동기대비 증가흐름을 지속하였다. 품목별로 보면 석유제품, 석유화학, 철강, 선박, 반도체, 자동차 등 대다수 품목에서 증가하였다. 석유제품은 글로벌 경기회복에 따른 에너지 수요 증가와 국제유가 급등으로 수출단가가 높은 상승세를 지속하면서 증가하였다. 석유화학도 중국, 아세안을 중심으로 합성수지, 고무 등의 수출이 큰 폭 증가한 데다 고유가로 인한 수출가격도 동반 상승하면서 증가세를 이어갔다. 철강은 건설, 조선 등 글로벌 전방산업의 수요 증대, 원자재가격 상승 및 중국 감산 등에 따른 수출단가 상승 등에 힘입어 증가세를 이어갔다. 선박은 1/4분기 중 인도물량이 확대됨에 따라 증가하였다. 반도체는 자동차 등 전방산업의 견조한 수요가 이어지는 가운데 전년동기대비로 높은 단가가 지속되면서 증가하였다. 자동차는 차량용 반도체 수급차질이 지속되었음에도 불구하고 글로벌 경기회복 흐름에 따라 수요가 늘어나면서 전년동기대비 소폭 증가하였다. 모니터링 결과 향후 수출은 증가세가 지속될 것으로 전망되었다. 석유화학 및 석유정제는 수출단가 상승과 전방산업의 수요확대 기조가 이어지면서 증가할 전망이다. 철강은 주요국 경기회복과 중국, 인도 등의 인프라 투자 확대 등으로 양호한 흐름을 이어갈 전망이다. 반도체는 글로벌 스마트폰 수요 회복, 디지털 전환 기조 등으로 견조한 증가세를 지속할 것으로 보인다. 자동차는 차량용 반도체 공급차질이 점차 완화되고 미국, 신흥시장을 중심으로 수요회복이 본격화됨에 따라 소폭 증가할 전망이다. 선박은 친환경 선박수요 지속, 글로별 교역 신장 등에도 불구하고 2021년 2/4분기 집중되었던 인도물량의 기저효과로 인해 감소할 것으로 보인다.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```
<!--
### Direct Usage (Transformers)
<details><summary>Click to see the direct usage in Transformers</summary>
</details>
-->
<!--
### Downstream Usage (Sentence Transformers)
You can finetune this model on your own dataset.
<details><summary>Click to expand</summary>
</details>
-->
<!--
### Out-of-Scope Use
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->
<!--
## Bias, Risks and Limitations
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->
<!--
### Recommendations
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->
## Training Details
### Training Hyperparameters
#### Non-Default Hyperparameters
- `per_device_train_batch_size`: 512
- `learning_rate`: 3e-05
- `num_train_epochs`: 5
- `warmup_ratio`: 0.05
- `fp16`: True
- `batch_sampler`: no_duplicates
#### All Hyperparameters
<details><summary>Click to expand</summary>
- `overwrite_output_dir`: False
- `do_predict`: False
- `eval_strategy`: no
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 512
- `per_device_eval_batch_size`: 8
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 1
- `eval_accumulation_steps`: None
- `torch_empty_cache_steps`: None
- `learning_rate`: 3e-05
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 1.0
- `num_train_epochs`: 5
- `max_steps`: -1
- `lr_scheduler_type`: linear
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.05
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `restore_callback_states_from_checkpoint`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `use_ipex`: False
- `bf16`: False
- `fp16`: True
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: True
- `dataloader_num_workers`: 0
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: False
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: False
- `resume_from_checkpoint`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_private_repo`: False
- `hub_always_push`: False
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `eval_do_concat_batches`: True
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`:
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `dispatch_batches`: None
- `split_batches`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: False
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_eval_metrics`: False
- `eval_on_start`: False
- `eval_use_gather_object`: False
- `batch_sampler`: no_duplicates
- `multi_dataset_batch_sampler`: proportional
</details>
### Training Logs
| Epoch | Step | Training Loss |
|:------:|:----:|:-------------:|
| 0.0085 | 1 | 2.0476 |
| 0.0171 | 2 | 2.0595 |
| 0.0256 | 3 | 2.0267 |
| 0.0342 | 4 | 2.0971 |
| 0.0427 | 5 | 2.2171 |
| 0.0513 | 6 | 2.287 |
| 0.0598 | 7 | 2.0867 |
| 0.0684 | 8 | 1.9498 |
| 0.0769 | 9 | 1.569 |
| 0.0855 | 10 | 1.3313 |
| 0.0940 | 11 | 1.4122 |
| 0.1026 | 12 | 1.3425 |
| 0.1111 | 13 | 1.1936 |
| 0.1197 | 14 | 0.8012 |
| 0.1282 | 15 | 0.8862 |
| 0.1368 | 16 | 1.193 |
| 0.1453 | 17 | 0.9771 |
| 0.1538 | 18 | 0.3887 |
| 0.1624 | 19 | 0.363 |
| 0.1709 | 20 | 0.3092 |
| 0.1795 | 21 | 0.2692 |
| 0.1880 | 22 | 0.2386 |
| 0.1966 | 23 | 0.2266 |
| 0.2051 | 24 | 0.233 |
| 0.2137 | 25 | 0.2214 |
| 0.2222 | 26 | 0.2038 |
| 0.2308 | 27 | 0.2015 |
| 0.2393 | 28 | 0.1772 |
| 0.2479 | 29 | 0.1697 |
| 0.2564 | 30 | 0.1718 |
| 0.2650 | 31 | 0.2456 |
| 0.2735 | 32 | 0.5238 |
| 0.2821 | 33 | 0.5308 |
| 0.2906 | 34 | 0.5111 |
| 0.2991 | 35 | 0.3931 |
| 0.3077 | 36 | 0.3414 |
| 0.3162 | 37 | 0.2704 |
| 0.3248 | 38 | 0.2949 |
| 0.3333 | 39 | 0.3082 |
| 0.3419 | 40 | 0.3755 |
| 0.3504 | 41 | 0.3127 |
| 0.3590 | 42 | 0.3756 |
| 0.3675 | 43 | 0.3564 |
| 0.3761 | 44 | 0.3905 |
| 0.3846 | 45 | 0.377 |
| 0.3932 | 46 | 0.3043 |
| 0.4017 | 47 | 0.3237 |
| 0.4103 | 48 | 0.4035 |
| 0.4188 | 49 | 0.4522 |
| 0.4274 | 50 | 0.4392 |
| 0.4359 | 51 | 0.4482 |
| 0.4444 | 52 | 0.3586 |
| 0.4530 | 53 | 0.3154 |
| 0.4615 | 54 | 0.4053 |
| 0.4701 | 55 | 0.5846 |
| 0.4786 | 56 | 0.4372 |
| 0.4872 | 57 | 0.6201 |
| 0.4957 | 58 | 0.5278 |
| 0.5043 | 59 | 0.4844 |
### Framework Versions
- Python: 3.10.12
- Sentence Transformers: 3.2.1
- Transformers: 4.44.2
- PyTorch: 2.3.1+cu121
- Accelerate: 1.1.1
- Datasets: 2.21.0
- Tokenizers: 0.19.1
## Citation
### BibTeX
#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
```
#### CachedMultipleNegativesRankingLoss
```bibtex
@misc{gao2021scaling,
title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
year={2021},
eprint={2101.06983},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
```
<!--
## Glossary
*Clearly define terms in order to be accessible across audiences.*
-->
<!--
## Model Card Authors
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->
<!--
## Model Card Contact
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
--> |