Program 1

Uploaded by

mickeypinky123

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

26 views2 pages

Program 1

Uploaded by

mickeypinky123

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 2

1Program 1: Counting words

import nltk
from nltk.corpus import gutenberg
import string
nltk.download()
# Example: Load the text of 'Moby Dick'
raw_text = gutenberg.raw('melville-moby_dick.txt')
import re

def preprocess_text(text):
# Remove punctuation
text = text.translate(str.maketrans('', '', string.punctuation))

# Convert to lowercase
text = text.lower()

# Tokenize

tokens = text.split()

return tokens

processed_text = preprocess_text(raw_text)
def calculate_statistics(tokens):
# Assuming one document for simplicity
document_count = 1

word_count = len(tokens)
unique_words = set(tokens)
unique_word_count = len(unique_words)

return document_count, word_count, unique_word_count

document_count, word_count, unique_word_count =

calculate_statistics(processed_text)

print("Document Count:", document_count)

print("Word Count:", word_count)
print("Unique Word Count:", unique_word_count)

Batch 2
No ratings yet
Batch 2
13 pages
NLP_Record(Weeks 1-12) (1)
No ratings yet
NLP_Record(Weeks 1-12) (1)
41 pages
CS Practical File
No ratings yet
CS Practical File
47 pages
Text File Question Bank Solutions
No ratings yet
Text File Question Bank Solutions
14 pages
SK NLP Practical (FS)
No ratings yet
SK NLP Practical (FS)
22 pages
All Practicals
No ratings yet
All Practicals
33 pages
Lab Manual - NLP
No ratings yet
Lab Manual - NLP
60 pages
TEXT FILE QUESTION AND ANSWERS
No ratings yet
TEXT FILE QUESTION AND ANSWERS
5 pages
Implement Word Count
No ratings yet
Implement Word Count
2 pages
Program 1 Read a text file and display the number of vowels
No ratings yet
Program 1 Read a text file and display the number of vowels
8 pages
Natural Language Processing Lab Manual
No ratings yet
Natural Language Processing Lab Manual
24 pages
Text File (3 Mark)
No ratings yet
Text File (3 Mark)
16 pages
20
No ratings yet
20
2 pages
anshika cs project
No ratings yet
anshika cs project
20 pages
CLASS XII TEXT FILE HANDLING ASSIGNMENT
No ratings yet
CLASS XII TEXT FILE HANDLING ASSIGNMENT
3 pages
Python File Exercises
No ratings yet
Python File Exercises
1 page
Problem Set 3: Document Distance: Pset Buddy
No ratings yet
Problem Set 3: Document Distance: Pset Buddy
7 pages
Python
No ratings yet
Python
13 pages
cs record
No ratings yet
cs record
33 pages
Python Experiments
No ratings yet
Python Experiments
13 pages
lecture10
No ratings yet
lecture10
7 pages
akshat sethi practical file
No ratings yet
akshat sethi practical file
50 pages
Practical File by Aksh Jaiswal
No ratings yet
Practical File by Aksh Jaiswal
48 pages
File Operations and Word Count Program in Python
No ratings yet
File Operations and Word Count Program in Python
9 pages
Ch-5 - File Handling
No ratings yet
Ch-5 - File Handling
15 pages
Text File Programs Xii C
No ratings yet
Text File Programs Xii C
6 pages
File Handling Programs
No ratings yet
File Handling Programs
15 pages
Text file and Binary file work sheet
No ratings yet
Text file and Binary file work sheet
2 pages
ANSHIKA'S PROJECT DO NOT TOUCH!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
No ratings yet
ANSHIKA'S PROJECT DO NOT TOUCH!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
15 pages
8th PGM
No ratings yet
8th PGM
4 pages
NLP Lab Manual
No ratings yet
NLP Lab Manual
15 pages
Text Files
No ratings yet
Text Files
16 pages
Coding
No ratings yet
Coding
10 pages
TEXT FILE HANDLING
No ratings yet
TEXT FILE HANDLING
4 pages
1.Home work-Text Files
No ratings yet
1.Home work-Text Files
1 page
string prgs
No ratings yet
string prgs
2 pages
CL_12_WORKSHEET_2_PROGRAMS_ON_FILE_HANDLING (1)
No ratings yet
CL_12_WORKSHEET_2_PROGRAMS_ON_FILE_HANDLING (1)
4 pages
Final_NLP_Lab_File
No ratings yet
Final_NLP_Lab_File
28 pages
Class 12 Practicle File (Python Programs)
No ratings yet
Class 12 Practicle File (Python Programs)
27 pages
FileHandringPractical Questions Python
No ratings yet
FileHandringPractical Questions Python
5 pages
Computer Scinece Practical File
No ratings yet
Computer Scinece Practical File
52 pages
random
No ratings yet
random
9 pages
Class 12 Cs Final Prac
No ratings yet
Class 12 Cs Final Prac
68 pages
Python Ass 2
No ratings yet
Python Ass 2
7 pages
Exercise51ec
No ratings yet
Exercise51ec
4 pages
Lab Task 8: Programming Exercises
100% (1)
Lab Task 8: Programming Exercises
3 pages
Ai&Ml Bai601 Nlp Lab Manual
No ratings yet
Ai&Ml Bai601 Nlp Lab Manual
48 pages
Text Files workbook
No ratings yet
Text Files workbook
8 pages
Practical File 2025-26
No ratings yet
Practical File 2025-26
33 pages
Text File Handling Set-2: 2 Marks Questions
No ratings yet
Text File Handling Set-2: 2 Marks Questions
2 pages
Text Processing
No ratings yet
Text Processing
16 pages
text_file[1]
No ratings yet
text_file[1]
2 pages
File Handling Programs With Solution
No ratings yet
File Handling Programs With Solution
28 pages
Assignment Textfile 20230525210733459 22052024 083944
No ratings yet
Assignment Textfile 20230525210733459 22052024 083944
6 pages
Ristructer
No ratings yet
Ristructer
3 pages
Homework 1: Instructions
No ratings yet
Homework 1: Instructions
3 pages
Lab Manual Ex 1-6 - 230508 - 182126
No ratings yet
Lab Manual Ex 1-6 - 230508 - 182126
14 pages
Thinksheet Class 12 Diwali Break
No ratings yet
Thinksheet Class 12 Diwali Break
1 page
C++ Functions and tutorial
From Everand
C++ Functions and tutorial
Nino Paiotta
No ratings yet
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
xyz
No ratings yet
xyz
27 pages
Programs code
No ratings yet
Programs code
7 pages
MODULE 4-IS
No ratings yet
MODULE 4-IS
79 pages
DV
No ratings yet
DV
30 pages
MODULE 4
No ratings yet
MODULE 4
112 pages
AP Constituency
No ratings yet
AP Constituency
20 pages

Program 1

Uploaded by

Program 1

Uploaded by

1Program 1: Counting words

return document_count, word_count, unique_word_count

document_count, word_count, unique_word_count =

print("Document Count:", document_count)

You might also like