Commits · Dovakiins/qwerrwe

Vram fix attempt (#1164) [skip ci]

32580c1
unverified

winglian commited on Jan 23, 2024

improve vram use w gradient checkpointing (#1167) [skip ci]

802f966
unverified

winglian commited on Jan 23, 2024

Add mlflow callback for pushing config to mlflow artifacts (#1125)

b8e5603
unverified

JohanWork commited on Jan 22, 2024

set fp16 to false if bf16, update bf16: auto in example YAMLs (#1122) [skip ci]

782b6a4
unverified

winglian

Nanobit commited on Jan 22, 2024

jupyter lab fixes (#1139) [skip ci]

eaaeefc
unverified

winglian commited on Jan 22, 2024

Qwen2 (#1166)

f5a828a
unverified

winglian commited on Jan 22, 2024

make sure the model config loader respects the model_revision too (#1160) [skip-ci]

fccb542
unverified

winglian commited on Jan 22, 2024

Deprecate max packed sequence len (#1141)

2ce5c0d
unverified

winglian commited on Jan 20, 2024

feat(dataset): add config to keep processed dataset in memory (#1152)

3db5f2f
unverified

Nanobit commited on Jan 20, 2024

fix check for env var (#1151)

cbecf3e
unverified

winglian commited on Jan 19, 2024

Dockerfile cloud ports (#1148)

729740d
unverified

winglian commited on Jan 19, 2024

Fix link for Minotaur model (#1146) [skip-ci]

08b8ba0
unverified

jrc commited on Jan 18, 2024

Multipack simplify for Mixtral (#1142)

6910e6a
unverified

winglian commited on Jan 18, 2024

Add shifted sparse attention (#973) [skip-ci]

1d70f24
unverified

jrc joecummings

winglian commited on Jan 18, 2024

fix bf16 check when preprocessing data (#1140)

317fa25
unverified

winglian commited on Jan 18, 2024

fix(preprocess): Make sure dataset not loaded from cache when using preprocess cli (#1136)

1e56b88
unverified

Nanobit commited on Jan 17, 2024

Preprocess dataset size fix (#1131)

7570446
unverified

winglian commited on Jan 17, 2024

Agnostic cloud gpu docker image and Jupyter lab (#1097)

ece0211
unverified

winglian commited on Jan 16, 2024

Add `layers_to_transform` for `lora_config` (#1118)

8487b97
unverified

xzuyn commited on Jan 16, 2024

fix(readme): clarify custom user prompt [no-ci] (#1124)

9cd27b2
unverified

Nanobit commited on Jan 16, 2024

pin model_revision for phi2 (#1123)

c1b741d
unverified

winglian commited on Jan 14, 2024

update PR template so we can capture twitter or discord handles (#1121) [skip ci]

0abf4d6
unverified

winglian commited on Jan 14, 2024

Enable or disable bf16 support based on availability (#1116)

0865613
unverified

Simon Hällqvist commited on Jan 14, 2024

Reverse caching PR (#1115)

2202a20
unverified

casperhansen commited on Jan 13, 2024

Disable caching on `--disable_caching` in CLI (#1110)

d66b101
unverified

casperhansen

winglian commited on Jan 13, 2024

Update debugging.md (#1111)

304ea1b
unverified

hamel commited on Jan 13, 2024

keep gate in fp32 for 16 bit loras (#1105)

da97285
unverified

winglian commited on Jan 12, 2024

Add link on README to Docker Debugging (#1107)

2dc4310
unverified

hamel

winglian commited on Jan 12, 2024

Add section for debugging with Docker (#1104)

6d342b5
unverified

hamel

winglian commited on Jan 12, 2024

Update README.md (#1103)

b502392
unverified

hamel commited on Jan 12, 2024

Fix broken pypi.yml (#1099) [skip ci]

44ba616
unverified

marksaroufim commited on Jan 11, 2024

feat: enable trl's autounwrap (#1060)

b432889
unverified

Nanobit commited on Jan 11, 2024

Fix debugging.md (#1091)

54fe07a
unverified

hamel commited on Jan 11, 2024

Add Debugging Guide (#1089)

7512c3a
unverified

hamel

winglian commited on Jan 11, 2024

add gptneox embeddings, fix phi2 inputs, also fix the casting (#1083)

78c5b19
unverified

winglian commited on Jan 11, 2024

misc fixes from #943 (#1086) [skip ci]

23495a8
unverified

winglian commited on Jan 11, 2024