Support `None` to reset pre_tokenizers and normalizers, and index sequences #1590

ArthurZucker · 2024-08-04T17:06:35Z

HuggingFaceDocBuilderDev · 2024-08-04T17:08:55Z

The docs for this PR live here. All of your documentation changes will be reflected on that endpoint. The docs are available until 30 days after the last update.

…o fix-sequences

Narsil

LGTM

itazap · 2024-08-09T12:57:57Z

Nice! works great! I am able to iter over a normalizer.Sequence as in the screenshot, but not over tokenizer.Sequence. Is it possible to please add support for that? 🙏

ArthurZucker added 3 commits August 4, 2024 14:01

initial commit

4bce6b2

support None

908a5be

fix clippy

e5872f0

ArthurZucker added 4 commits August 4, 2024 19:20

cleanup

79af84f

clean?

1d44d2c

propagate to pre_tokenizer

c2cccc8

fix test

ac15c15

ArthurZucker marked this pull request as ready for review August 6, 2024 14:09

ArthurZucker added 7 commits August 6, 2024 16:16

fix rust tests

458368c

fix node

34b8f89

propagate to decoder and post processor

1b926f3

fix calls

44a63eb

lint

d30e10f

fmt

c4b1470

node be happy I am fixing you

a330807

ArthurZucker requested a review from Narsil August 6, 2024 15:27

ArthurZucker added 13 commits August 7, 2024 11:10

initial commit

891186a

support None

c1fc9f1

fix clippy

7248894

cleanup

84c0685

clean?

ef0a697

propagate to pre_tokenizer

1ec38e3

fix test

3c143fd

fix rust tests

186a55e

fix node

c57a556

propagate to decoder and post processor

645cdec

fix calls

624b520

lint

2ecaed1

fmt

3b89f7f

ArthurZucker and others added 5 commits August 7, 2024 11:10

node be happy I am fixing you

fa5fa08

Merge branch 'fix-sequences' of github.com:huggingface/tokenizers int…

5cd1f75

…o fix-sequences

add a small test

0e512fb

styling

4e8ee6e

Merge branch 'main' into fix-sequences

af12117

Narsil approved these changes Aug 7, 2024

View reviewed changes

ArthurZucker added 5 commits August 7, 2024 12:12

style merge

ca1534b

fix merge test

886be88

fmt

e772707

nits

2e125bf

update tset

2de36e3

ArthurZucker merged commit bded212 into main Aug 7, 2024
13 checks passed

ArthurZucker deleted the fix-sequences branch August 7, 2024 10:52

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Support `None` to reset pre_tokenizers and normalizers, and index sequences #1590

Support `None` to reset pre_tokenizers and normalizers, and index sequences #1590

ArthurZucker commented Aug 4, 2024 •

edited

Loading

HuggingFaceDocBuilderDev commented Aug 4, 2024

Narsil left a comment

itazap commented Aug 9, 2024

Support None to reset pre_tokenizers and normalizers, and index sequences #1590

Support None to reset pre_tokenizers and normalizers, and index sequences #1590

Conversation

ArthurZucker commented Aug 4, 2024 • edited Loading

HuggingFaceDocBuilderDev commented Aug 4, 2024

Narsil left a comment

Choose a reason for hiding this comment

itazap commented Aug 9, 2024

Support `None` to reset pre_tokenizers and normalizers, and index sequences #1590

Support `None` to reset pre_tokenizers and normalizers, and index sequences #1590

ArthurZucker commented Aug 4, 2024 •

edited

Loading