0% found this document useful (0 votes)

37 views2 pages

QA Using Gemini Langchain ChromaDB PDF

Python

Uploaded by

winafa4921

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

37 views2 pages

QA Using Gemini Langchain ChromaDB PDF

Python

Uploaded by

winafa4921

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 2

!

pip -q install langchain openai tiktoken chromadb pypdf sentence_transformers

InstructorEmbedding
!pip install langchain-google-genai
!pip show langchain
!pip install -U langchain-community

from langchain_google_genai import GoogleGenerativeAI

import os
#os.environ["GOOGLE_GENAI_CLIENT_INFO_KEY"] = ""
os.environ["GOOGLE_API_KEY"] = "AIzaSyBc1M6tEFkimB8AuQcSHNqluPW5E3Wc6Ys"

!wget -q https://www.dropbox.com/s/zoj9rnm7oyeaivb/new_papers.zip
!unzip -q new_papers.zip -d new_papers

from langchain.vectorstores import Chroma

from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains import RetrievalQA
from langchain.document_loaders import TextLoader
from langchain.document_loaders import PyPDFLoader
from langchain.document_loaders import DirectoryLoader
from InstructorEmbedding import INSTRUCTOR
from langchain.embeddings import HuggingFaceInstructEmbeddings

# Load and process the text files

# loader = TextLoader('single_text_file.txt')
loader = DirectoryLoader('./new_papers/new_papers/', glob="./*.pdf",
loader_cls=PyPDFLoader)
documents = loader.load()
len(documents)

#splitting the text into

text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
texts = text_splitter.split_documents(documents)
len(texts)

# from langchain.embeddings import HuggingFaceEmbeddings,

SentenceTransformerEmbeddings
# model_name = "sentence-transformers/all-mpnet-base-v2"
# hf = HuggingFaceEmbeddings(model_name=model_name)

from langchain.embeddings import HuggingFaceInstructEmbeddings

instructor_embeddings =
HuggingFaceInstructEmbeddings(model_name="hkunlp/instructor-xl",
model_kwargs={"device":
"cuda"})

# Embed and store the texts

# Supplying a persist_directory will store the embeddings on disk
persist_directory = 'db'
## Here is the new embeddings being used
embedding = instructor_embeddings
vectordb = Chroma.from_documents(documents=texts,
embedding=embedding,
persist_directory=persist_directory)

# persiste the db to disk

vectordb.persist()
vectordb = None
# Now we can load the persisted database from disk, and use it as normal.
vectordb = Chroma(persist_directory=persist_directory,
embedding_function=embedding)

retriever = vectordb.as_retriever()
docs = retriever.get_relevant_documents("What is Flash attention?")
len(docs)
retriever = vectordb.as_retriever(search_kwargs={"k": 3})
retriever.search_type
retriever.search_kwargs

# create the chain to answer questions

qa_chain = RetrievalQA.from_chain_type(llm=OpenAI(),
chain_type="stuff",
retriever=retriever,
return_source_documents=True)

## Cite sources

import textwrap

def wrap_text_preserve_newlines(text, width=110):

# Split the input text into lines based on newline characters
lines = text.split('\n')

# Wrap each line individually

wrapped_lines = [textwrap.fill(line, width=width) for line in lines]

# Join the wrapped lines back together using newline characters

wrapped_text = '\n'.join(wrapped_lines)

return wrapped_text

def process_llm_response(llm_response):
print(wrap_text_preserve_newlines(llm_response['result']))
print('\n\nSources:')
for source in llm_response["source_documents"]:
print(source.metadata['source'])

query = "What is Flash attention?"

llm_response = qa_chain(query)
process_llm_response(llm_response)

Computer Networks and Security (18CS52) Notes
67% (9)
Computer Networks and Security (18CS52) Notes
218 pages
Lab Experiment 1 LLM
No ratings yet
Lab Experiment 1 LLM
3 pages
NLPM 21
No ratings yet
NLPM 21
31 pages
Lecture 31-Document GPT Hands On
No ratings yet
Lecture 31-Document GPT Hands On
18 pages
Multimodel Text
No ratings yet
Multimodel Text
9 pages
MultiModel RAG
No ratings yet
MultiModel RAG
18 pages
DL Pro 456
No ratings yet
DL Pro 456
8 pages
Gen Ai 7,8,9,10
No ratings yet
Gen Ai 7,8,9,10
7 pages
1st Programme
No ratings yet
1st Programme
16 pages
Labsheet 9
No ratings yet
Labsheet 9
2 pages
RAG With Reinforcement Learning
No ratings yet
RAG With Reinforcement Learning
40 pages
Notes - by Kishor
No ratings yet
Notes - by Kishor
11 pages
Case Study
No ratings yet
Case Study
25 pages
Claude Comparet DB
No ratings yet
Claude Comparet DB
8 pages
Mini Project Docubot Power Point
No ratings yet
Mini Project Docubot Power Point
17 pages
Flowise AI Tutorial #3 File Loaders, Text Splitters, Embeddings & Vector Stores
No ratings yet
Flowise AI Tutorial #3 File Loaders, Text Splitters, Embeddings & Vector Stores
3 pages
Finally Final
No ratings yet
Finally Final
18 pages
Langchain Onepager
No ratings yet
Langchain Onepager
1 page
CODE Explanation
No ratings yet
CODE Explanation
6 pages
BG Embeddings (BGE), Llama v2, LangChain, and Chroma For Retrieval QA - by Datadrifters - Aug, 2023 - GoPenAI
No ratings yet
BG Embeddings (BGE), Llama v2, LangChain, and Chroma For Retrieval QA - by Datadrifters - Aug, 2023 - GoPenAI
18 pages
How I Built A Basic RAG For PDF QA in A Few Lines of Python Code - by DR Julija - Medium
No ratings yet
How I Built A Basic RAG For PDF QA in A Few Lines of Python Code - by DR Julija - Medium
8 pages
Demo
No ratings yet
Demo
3 pages
GenAI Final Project
No ratings yet
GenAI Final Project
8 pages
Natural Language Processing Lab 9
No ratings yet
Natural Language Processing Lab 9
13 pages
Import Gensim
No ratings yet
Import Gensim
8 pages
Gen AI Lab
No ratings yet
Gen AI Lab
22 pages
Lab Experiment 1
No ratings yet
Lab Experiment 1
3 pages
NLP Exp 9 Outputs
No ratings yet
NLP Exp 9 Outputs
2 pages
Super Quick - In-Context Learning With Personal Data Using LLAMA 2.0 On CPU - by Ashhadul Islam - Aug, 2023 - Python in Plain English
No ratings yet
Super Quick - In-Context Learning With Personal Data Using LLAMA 2.0 On CPU - by Ashhadul Islam - Aug, 2023 - Python in Plain English
20 pages
Chatbot Code
No ratings yet
Chatbot Code
2 pages
Gen Project
No ratings yet
Gen Project
7 pages
Synopsis
No ratings yet
Synopsis
3 pages
20BCE1779 - Web Mining - Lab-4
No ratings yet
20BCE1779 - Web Mining - Lab-4
10 pages
Gen AIL
No ratings yet
Gen AIL
12 pages
LLM Prcess
No ratings yet
LLM Prcess
7 pages
Pgi20s02j - Lab Record
No ratings yet
Pgi20s02j - Lab Record
24 pages
Project Documentation - PDF Q&A With Gemini (LangChain Practical Implementation)
No ratings yet
Project Documentation - PDF Q&A With Gemini (LangChain Practical Implementation)
6 pages
RAG Application Using Open Source Tools 1721123882
No ratings yet
RAG Application Using Open Source Tools 1721123882
5 pages
Zref
No ratings yet
Zref
8 pages
AIlab 10
No ratings yet
AIlab 10
3 pages
02 Data Connections
No ratings yet
02 Data Connections
32 pages
LAB MANUAL OF GENERATIVE AI April - 4
No ratings yet
LAB MANUAL OF GENERATIVE AI April - 4
17 pages
Chatbot Code
No ratings yet
Chatbot Code
2 pages
A-Z of RAG Question Answering Methods in Langchain
No ratings yet
A-Z of RAG Question Answering Methods in Langchain
33 pages
Cs 3308 Unit 7 Programming Assignment
No ratings yet
Cs 3308 Unit 7 Programming Assignment
8 pages
Chatbot Code
No ratings yet
Chatbot Code
2 pages
Langchain App Design
No ratings yet
Langchain App Design
7 pages
Bootcamp GenAI AgenticAI Backend Engineers MacBook
No ratings yet
Bootcamp GenAI AgenticAI Backend Engineers MacBook
3 pages
Langchain N VDB
No ratings yet
Langchain N VDB
6 pages
Ali Ahmad and Rameez - Project - Proposal
No ratings yet
Ali Ahmad and Rameez - Project - Proposal
5 pages
Duckduckgo Download
No ratings yet
Duckduckgo Download
3 pages
Gen Ai-1
No ratings yet
Gen Ai-1
6 pages
Introduction
No ratings yet
Introduction
17 pages
Python Scripts
No ratings yet
Python Scripts
5 pages
An Effective Query System Using Llms and Langchain IJERTV12IS060161
No ratings yet
An Effective Query System Using Llms and Langchain IJERTV12IS060161
3 pages
Sithfal-Task2 Explation Matter
No ratings yet
Sithfal-Task2 Explation Matter
6 pages
Introducing Transformers Agents 20
No ratings yet
Introducing Transformers Agents 20
8 pages
Building RAG Apps
No ratings yet
Building RAG Apps
32 pages
Gen Ai Lab - DS
No ratings yet
Gen Ai Lab - DS
26 pages
Manufacturing Execution System (MES) : Deployment Guide
No ratings yet
Manufacturing Execution System (MES) : Deployment Guide
47 pages
CyberAces Module1-Windows 7 Registry
No ratings yet
CyberAces Module1-Windows 7 Registry
13 pages
VxRail - Sas3ircu Runtime Error Caused Disks Shown As - Lost - in VxRail Manager Physical View On Quanta Appliance - Dell Singapore
No ratings yet
VxRail - Sas3ircu Runtime Error Caused Disks Shown As - Lost - in VxRail Manager Physical View On Quanta Appliance - Dell Singapore
3 pages
Beginners Guide To Successful Cardsharing
No ratings yet
Beginners Guide To Successful Cardsharing
8 pages
Ocs Cross Cancel Drucegrove
No ratings yet
Ocs Cross Cancel Drucegrove
6 pages
RetroMagazine 14 Eng
No ratings yet
RetroMagazine 14 Eng
82 pages
A Master Boot Record
No ratings yet
A Master Boot Record
4 pages
CCNA 2 v70 Final Exam Answers Full Switching Routing and Wireless Essentials PDF
100% (1)
CCNA 2 v70 Final Exam Answers Full Switching Routing and Wireless Essentials PDF
139 pages
Spectra2 Reference Manual
No ratings yet
Spectra2 Reference Manual
188 pages
DCS9900 1269-CP2 Installation Service and User Guide
No ratings yet
DCS9900 1269-CP2 Installation Service and User Guide
147 pages
CCNA 2 Final Exam V4
No ratings yet
CCNA 2 Final Exam V4
13 pages
HWUnifiedBasicPanelsitIT It IT
No ratings yet
HWUnifiedBasicPanelsitIT It IT
148 pages
8085 Instruction Set and Programming
No ratings yet
8085 Instruction Set and Programming
21 pages
How To Register, Install and Authorise Synthogy Download Edition
No ratings yet
How To Register, Install and Authorise Synthogy Download Edition
8 pages
Chapter1 Exercise QnA
No ratings yet
Chapter1 Exercise QnA
6 pages
PingCastle v2.9.0
No ratings yet
PingCastle v2.9.0
39 pages
GTX 970 User Guide
No ratings yet
GTX 970 User Guide
31 pages
Nvidia P401-A02 g84-400 256mb gddr3 SCH
No ratings yet
Nvidia P401-A02 g84-400 256mb gddr3 SCH
22 pages
03 VXVM Diskgroup Operations
100% (1)
03 VXVM Diskgroup Operations
5 pages
BSIT First Year Lesson
No ratings yet
BSIT First Year Lesson
3 pages
Bill Gates
No ratings yet
Bill Gates
2 pages
Operating System
No ratings yet
Operating System
15 pages
Android: Android Application Components or Building Blocks
No ratings yet
Android: Android Application Components or Building Blocks
2 pages
NW SQL Server Internals & Architecture Atl2017
No ratings yet
NW SQL Server Internals & Architecture Atl2017
24 pages
Supercomputer Benchmarking
No ratings yet
Supercomputer Benchmarking
18 pages
Dynamic Scheduling Using Tomasulo's Approach
No ratings yet
Dynamic Scheduling Using Tomasulo's Approach
4 pages
Crucial Mx200 SSD Product Flyer Letter en
No ratings yet
Crucial Mx200 SSD Product Flyer Letter en
2 pages
Data Sheet 6ES7312-1AE13-0AB0: General Information
No ratings yet
Data Sheet 6ES7312-1AE13-0AB0: General Information
8 pages
Ddos Incident Cheat Sheet
No ratings yet
Ddos Incident Cheat Sheet
1 page

QA Using Gemini Langchain ChromaDB PDF

Uploaded by

QA Using Gemini Langchain ChromaDB PDF

Uploaded by

!

pip -q install langchain openai tiktoken chromadb pypdf sentence_transformers

from langchain_google_genai import GoogleGenerativeAI

from langchain.vectorstores import Chroma

# Load and process the text files

#splitting the text into

# from langchain.embeddings import HuggingFaceEmbeddings,

from langchain.embeddings import HuggingFaceInstructEmbeddings

# Embed and store the texts

# persiste the db to disk

# create the chain to answer questions

def wrap_text_preserve_newlines(text, width=110):

# Wrap each line individually

# Join the wrapped lines back together using newline characters

query = "What is Flash attention?"

You might also like