Spaces:

Dovakiins
/

qwerrwe

Build error

App Files Files Community

qwerrwe / src

Commit History

pad_to_worst_case_seq_len boolean, for testing memory limits (#498)

8e197f6
unverified

Birch-san

tmm1 commited on Aug 28, 2023

simplify linear layer locator

267b7b2

tmm1 commited on Aug 28, 2023

fsdp requires params be the same type too (#493)

98bf76e
unverified

winglian commited on Aug 28, 2023

Fix(tokenizer): Make sure to add pad for CodeLlamaTokenizer (#489)

4c37bd0
unverified

Nanobit commited on Aug 28, 2023

fix condition and add logging

3a011ea

tmm1 commited on Aug 27, 2023

Merge branch 'main' into patch-4

1f613e5

tmm1 commited on Aug 27, 2023

rename var and reformat

f319b0b

tmm1 commited on Aug 27, 2023

Update src/axolotl/utils/models.py

7fd662d
unverified

Maxime

tmm1 commited on Aug 27, 2023

Update src/axolotl/utils/models.py

9e69968
unverified

Maxime

tmm1 commited on Aug 27, 2023

let transformers handle adamw_bnb_8bit

868530c

tmm1 commited on Aug 26, 2023

ignore: address pr review

d03887f
unverified

Maxime commited on Aug 26, 2023

ignore: linter

a184549
unverified

Maxime commited on Aug 26, 2023

fix: finetune model inference needs the dtype fix to work with flash-attn

f311df9
unverified

Maxime commited on Aug 26, 2023

fix checkpints on multigpu (#481)

31f3e71
unverified

winglian commited on Aug 26, 2023

fix types w lora (#478)

0b7ba57
unverified

winglian commited on Aug 25, 2023

Fix(tokenizer): Fix condition to add pad token (#477)

71bd062
unverified

Nanobit commited on Aug 25, 2023

improve llama pad token handling (#475)

cb9797e
unverified

winglian commited on Aug 24, 2023

ReLoRA implementation (with quantization) (#322)

bde3c5a
unverified

winglian commited on Aug 24, 2023

workaround so training doesn't hang when packed dataloader batches aren't even (#461)

c69faee
unverified

winglian commited on Aug 23, 2023

feat: add Metharme prompt strategy (#446)

f474650
unverified

TearGosling

Nanobit commited on Aug 22, 2023

recast loralayer, norm, lmhead + embed token weights per original qlora (#393)

96deb6b
unverified

winglian commited on Aug 21, 2023

always drop samples that are too long (#452)

50682a3
unverified

winglian commited on Aug 21, 2023

set env var for FSDP layer to wrap (#453)

5a1985b
unverified

winglian commited on Aug 21, 2023

fix eval regression caused in 13f7efaf74fcd3c4514277ccb71914c589873f6a

a213d99

tmm1 commited on Aug 21, 2023

is_causal fix for evals?

fbf49a4

winglian commited on Aug 21, 2023

add missing positional arg (#450)

58cf7e7
unverified

winglian commited on Aug 21, 2023

fix evals (#447)

ee26281
unverified

winglian commited on Aug 21, 2023

gracefully handle empty input (#442)

9d629d8
unverified

winglian commited on Aug 20, 2023

support user defined prompters, pretokenized datasets in config, local parquet, local arrow files (#348)

d2e7f27
unverified

winglian commited on Aug 20, 2023

disable eval using multipack for now (#437)

f733d0f
unverified

winglian commited on Aug 19, 2023

fix comma, not a tuple (#436)

008505c
unverified

winglian commited on Aug 19, 2023

use save_strategy from config if available (#434)

b3f5e00
unverified

winglian commited on Aug 19, 2023

set env for FSDP offload params (#433)

5247c50
unverified

winglian commited on Aug 19, 2023

standardize attn hijack patches (#381)

06edf17
unverified

winglian commited on Aug 18, 2023

adds color (#425)

0a22847
unverified

winglian commited on Aug 18, 2023

fix orca prompts (#422)

1b7e860
unverified

winglian commited on Aug 16, 2023

Fix(config): Update handling of deepspeed config (#404)

c01015f
unverified

Nanobit commited on Aug 15, 2023

fix eval steps and strategy (#403)

da10af0
unverified

winglian commited on Aug 15, 2023

better handling of empty input ids when tokenizing (#395)

85cf4f8
unverified

winglian commited on Aug 15, 2023

add utils.data.prepare_dataset

2e22404

tmm1 commited on Aug 15, 2023

use context manager to run things on rank0 before others (#397)

fc2d6be
unverified

winglian commited on Aug 15, 2023

don't use mask expansion for inference (#392)

1687be6
unverified

winglian commited on Aug 15, 2023

Feat(config): add max steps (#387)

3c2ad00
unverified

ittailup commited on Aug 14, 2023

Added "epoch" evaluation_strategy (#388)

5d48a10
unverified

flotos commited on Aug 14, 2023

Feat(config): Add hub_strategy (#386)

73a0b6e
unverified

Nanobit commited on Aug 14, 2023

Error msg for sharegpt if conv has less than 2 msg (#379)

63fdb5a
unverified

flotos commited on Aug 14, 2023

don't pass rope_scaling kwarg if it's None (#383)

919246f
unverified

winglian commited on Aug 13, 2023

Fix crash when running without CUDA

15f6e57

chargoddard commited on Aug 13, 2023

try to detect accelerate and only use device_map=None in that case (#373)

094fc2c
unverified

tmm1 commited on Aug 13, 2023

fix check for flash attn branching (#377)

343ac84
unverified

winglian commited on Aug 13, 2023