Spaces:

Dovakiins
/

qwerrwe

Build error

App Files Files Community

qwerrwe / README.md

Commit History

fix(readme): Clarify doc for tokenizer_config (#1323) [skip ci]

2ed52bd
unverified

Nanobit commited on Feb 24, 2024

fix(readme): update inference md link (#1311) [skip ci]

3d2cd80
unverified

Nanobit commited on Feb 21, 2024

Add seq2seq eval benchmark callback (#1274)

5a5d474
unverified

LeonardoEmili commited on Feb 13, 2024

Scheduler implementation of Continual Pre-Training of Large Language Models: How to (re)warm your model? (#1273)

8430db2
unverified

jinwonkim93 commited on Feb 13, 2024

allow the optimizer prune ratio for ReLoRA to be configurable (#1287)

4b997c3
unverified

winglian commited on Feb 12, 2024

Update README.md (#1281)

b2a4cb4
unverified

hamel commited on Feb 9, 2024

add support for https remote yamls (#1277)

9bca7db
unverified

hamel commited on Feb 9, 2024

allow remote data paths (#1278)

91cf4ee
unverified

hamel commited on Feb 8, 2024

copy edits (#1276)

1daecd1
unverified

winglian commited on Feb 8, 2024

Add link to axolotl cloud image on latitude (#1275)

4a654b3
unverified

winglian commited on Feb 8, 2024

contributor avatars (#1269)

411293b
unverified

winglian commited on Feb 7, 2024

add contact info for dedicated support for axolotl [skip ci] (#1243)

dfd1885
unverified

winglian commited on Feb 1, 2024

support for true batches with multipack (#1230)

00568c1
unverified

winglian commited on Feb 1, 2024

Fix and document test_datasets (#1228)

5787e1a
unverified

DreamGenX

winglian commited on Jan 31, 2024

Peft lotfq (#1222)

4cb7900
unverified

winglian commited on Jan 28, 2024

Feat/chatml add system message (#1117)

98b4762
unverified

mhenrichsen Mads Henrichsen

winglian commited on Jan 25, 2024

Mixtral fixes 20240124 (#1192) [skip ci]

54d2ac1
unverified

winglian commited on Jan 24, 2024

update docs [skip ci] (#1176)

b715cd5
unverified

winglian commited on Jan 23, 2024

Fine-Tuning Mistral-7b for Real-World Chatbot Applications Using Axolotl (Lora used) (#1155)

cc25039
unverified

Tilemachos Chatzipapas twenty8th

winglian commited on Jan 23, 2024

Update README.md (#1169) [skip ci]

9135b9e
unverified

Ayush Singh commited on Jan 23, 2024

set fp16 to false if bf16, update bf16: auto in example YAMLs (#1122) [skip ci]

782b6a4
unverified

Nanobit commited on Jan 22, 2024

Deprecate max packed sequence len (#1141)

2ce5c0d
unverified

winglian commited on Jan 20, 2024

feat(dataset): add config to keep processed dataset in memory (#1152)

3db5f2f
unverified

Nanobit commited on Jan 20, 2024

Fix link for Minotaur model (#1146) [skip-ci]

08b8ba0
unverified

jrc commited on Jan 18, 2024

Add shifted sparse attention (#973) [skip-ci]

1d70f24
unverified

jrc joecummings

winglian commited on Jan 18, 2024

Agnostic cloud gpu docker image and Jupyter lab (#1097)

ece0211
unverified

winglian commited on Jan 16, 2024

Add `layers_to_transform` for `lora_config` (#1118)

8487b97
unverified

xzuyn commited on Jan 16, 2024

fix(readme): clarify custom user prompt [no-ci] (#1124)

9cd27b2
unverified

Nanobit commited on Jan 16, 2024

Add link on README to Docker Debugging (#1107)

2dc4310
unverified

winglian commited on Jan 12, 2024

Update README.md (#1103)

b502392
unverified

hamel commited on Jan 12, 2024

Add Debugging Guide (#1089)

7512c3a
unverified

winglian commited on Jan 11, 2024

paired kto support (#1069)

d7057cc
unverified

winglian commited on Jan 9, 2024

Add: mlflow for experiment tracking (#1059) [skip ci]

090c24d
unverified

Johan Hansson

winglian commited on Jan 9, 2024

Cosine learning rate schedule - minimum learning rate (#1062)

04b978b
unverified

winglian commited on Jan 9, 2024

Sponsors (#1065)

1496441
unverified

winglian commited on Jan 8, 2024

feature: better device mapping for large models (#918)

bdfefaf
unverified

kallewoof Karl-Johan Alm

winglian commited on Jan 5, 2024

set default for merge (#1044)

63fb3eb
unverified

hamel commited on Jan 5, 2024

[Docs] delete unused cfg value `lora_out_dir` (#1029)

a3e8783
unverified

Nanobit commited on Jan 3, 2024

chore(readme): update instruction to set config to load from cache (#1030)

b31038a
unverified

Nanobit commited on Jan 3, 2024

use recommended setting for use_reentrant w gradient checkpointing (#1021)

4d2e842
unverified

winglian commited on Jan 2, 2024

Adds chat templates (#1022)

f8ae59b
unverified

mhenrichsen commited on Dec 29, 2023

feat: expose bnb kwargs (#1018)

41353d2
unverified

hamel commited on Dec 29, 2023

feat: remove need to add load_in* during merge (#1017)

f6ecf14
unverified

Nanobit commited on Dec 29, 2023

[Docs] Nit: Remind people to auth to wandb if they are going to use it (#1013)

dec66d7
unverified

hamel commited on Dec 29, 2023

Update README.md (#1012)

76357dc
unverified

hamel commited on Dec 29, 2023

remove landmark attn and xpos rope implementations (#1010)

70b46ca
unverified

winglian commited on Dec 28, 2023

Update README.md (#966)

d25c34c
unverified

eltociear commited on Dec 17, 2023

Add docs (#947)

712fd27
unverified

winglian commited on Dec 13, 2023

fix: switch to using the HuggingFace Transformers NEFT implementation (#941)

ef24342
unverified

kallewoof commited on Dec 13, 2023

More hints on what to do with CUDA Out of memory errors (#925)

b0cf397
unverified

Juraj Bednar commited on Dec 13, 2023