AI AGENT DOCUMENT PROCESSING WITH LANGCHAIN

This project demonstrates how to process, chunk, and index documents using LangChain to build a vector store for retrieving information about AI agents. It supports multiple document types like text, web pages, and PDFs, and uses OpenAI embeddings for similarity search.

FEATURES

Load documents from:
- Text files
- Web pages
- PDF files
Process documents by chunking with customizable size and overlap.
Index documents in a vector store using OpenAI embeddings.
Perform a similarity search to retrieve the most relevant documents for a query.

REQUIREMENTS

Python 3.7+
Libraries:
- langchain-community
- dotenv
- bs4
- chromadb

Installation

Clone the repository:

git clone https://github.com/aditya10avg/RAG-Pipeline---LangChain-.git
cd RAG-Pipeline---LangChain-

Create a virtual environment and activate it:

  python3 -m venv venv
  source venv/bin/activate   # On Windows: venv\Scripts\activate

Install dependencies
```
   pip install -r requirements.txt
```
Set up your .env file.

  OPEN_AI_API_KEY=your_openai_api_key

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
lang		lang
.gitignore		.gitignore
Lang.ipynb		Lang.ipynb
README.md		README.md
ai_agents.pdf		ai_agents.pdf
requirements.txt		requirements.txt
speech.txt		speech.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI AGENT DOCUMENT PROCESSING WITH LANGCHAIN

FEATURES

REQUIREMENTS

Installation

USAGE

1. SCRAPPING WEB PAGE FOR Q&A

2. PDF Q&A

TECH STACKS USED

1. OPENAI EMBEDDINGS

2. LANGCHAIN

3. BEAUTIFUL SOUP

4. CHROMA DB

RAG WORKFLOW FOR DOCUMENT PROCESSING AND CREATING A Q&A WITH ITS VECTORE STORAGE

About

Releases

Packages

Languages

aditya10avg/RAG-Pipeline-LangChain-

Folders and files

Latest commit

History

Repository files navigation

AI AGENT DOCUMENT PROCESSING WITH LANGCHAIN

FEATURES

REQUIREMENTS

Installation

USAGE

1. SCRAPPING WEB PAGE FOR Q&A

2. PDF Q&A

TECH STACKS USED

1. OPENAI EMBEDDINGS

2. LANGCHAIN

3. BEAUTIFUL SOUP

4. CHROMA DB

RAG WORKFLOW FOR DOCUMENT PROCESSING AND CREATING A Q&A WITH ITS VECTORE STORAGE

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages