[blog] Choosing Embedding Models #1439

davidmyriel · 2025-01-30T22:48:17Z

netlify · 2025-01-30T22:48:43Z

✅ Deploy Preview for condescending-goldwasser-91acf0 ready!

Name	Link
🔨 Latest commit	`a998fbf`
🔍 Latest deploy log	https://app.netlify.com/sites/condescending-goldwasser-91acf0/deploys/679cfba93b42300008524206
😎 Deploy Preview	https://deploy-preview-1439--condescending-goldwasser-91acf0.netlify.app
📱 Preview on mobile	Toggle QR Code... Use your smartphone camera to open QR code link.

To edit notification comments on pull requests, go to your Netlify site configuration.

AstraBert · 2025-01-31T09:12:11Z

Hi there, the blog is fantastic, thank you soooo much!❤️

There is just a little imprecision in sentrev usage example:

This (line 76-81)

from sentrev import SentrevEvaluator

evaluator = SentrevEvaluator(client=client, data_files=["data1.pdf", "data2.docx"], models=["all-mpnet-base-v2", "mini-lm"])
evaluator.evaluate()

Should be:

from sentrev.evaluator import evaluate_dense_retrieval
from sentence_transformers import SentenceTransformer
# Define all the encoders
dense_encoder1 = SentenceTransformer('sentence-transformers/all-mpnet-base-v2', device="cuda")
dense_encoder2 = SentenceTransformer('sentence-transformers/all-MiniLM-L12-v2', device="cuda")
dense_encoder3 = SentenceTransformer('sentence-transformers/LaBSE', device="cuda")
# Evaluate retrieval!
evaluate_dense_retrieval(files = ["data1.pdf", "data2.docx"],  encoders = [dense_encoder1, dense_encoder2, dense_encoder3], encoder_to_names = { dense_encoder1: 'all-mpnet-base-v2', dense_encoder2: 'all-MiniLM-L12-v2', dense_encoder3: 'LaBSE'}, client = client, csv_path="~/evals/dense_stats.csv", chunking_size = 1500, text_percentage=0.3, distance="dot", mrr=10, carbon_tracking="USA", plot=True)

Would be also great if we could put the actual link to the GitHub repo :)

Should I implement these changes or can you do it?
Thanks a lot!🥰

AstraBert · 2025-01-31T15:57:08Z

This looks awesome, thank you so much! :)

add blog

1ebaf4d

image

198e3a9

add code and links

1e6e090

Update social_preview.png

a998fbf

davidmyriel merged commit c46fcfb into master Jan 31, 2025
5 checks passed

davidmyriel deleted the choosing-embedding-models branch January 31, 2025 16:37

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[blog] Choosing Embedding Models #1439

[blog] Choosing Embedding Models #1439

davidmyriel commented Jan 30, 2025 •

edited

Loading

netlify bot commented Jan 30, 2025 •

edited

Loading

AstraBert commented Jan 31, 2025

AstraBert commented Jan 31, 2025

[blog] Choosing Embedding Models #1439

[blog] Choosing Embedding Models #1439

Conversation

davidmyriel commented Jan 30, 2025 • edited Loading

netlify bot commented Jan 30, 2025 • edited Loading

✅ Deploy Preview for condescending-goldwasser-91acf0 ready!

AstraBert commented Jan 31, 2025

AstraBert commented Jan 31, 2025

davidmyriel commented Jan 30, 2025 •

edited

Loading

netlify bot commented Jan 30, 2025 •

edited

Loading