All Projects → peterdalle → svensktext

peterdalle / svensktext

Licence: other
Svenska språkresurser: kvinno- och mansnamn, orter, län, kommuner, länder, nationaliteter, yrken, sentimentlexikon, moral, stoppord, myndigheter m.m.

Programming Languages

python
139335 projects - #7 most used programming language
C#
18002 projects
r
7636 projects

Projects that are alternatives of or similar to svensktext

CheckableTextView
A simple and flexible Checked TextView or Checkable TextView
Stars: ✭ 108 (+100%)
Mutual labels:  text
glText
Cross-platform single header text rendering library for OpenGL
Stars: ✭ 93 (+72.22%)
Mutual labels:  text
heroku-buildpack-tex
A Heroku buildpack to run TeX Live inside a dyno.
Stars: ✭ 18 (-66.67%)
Mutual labels:  text
search-all-tabs
search all opened tabs in a browser popup and see the matching previews using Xapain or Lunrjs engines.
Stars: ✭ 48 (-11.11%)
Mutual labels:  text
Take-Notes
Huge Assignments to Write with only a little time in Hand?
Stars: ✭ 17 (-68.52%)
Mutual labels:  text
glitched-writer
Glitched, text writing js module. Highly customizable settings. Decoding, decrypting, scrambling, or simply spelling out text.
Stars: ✭ 51 (-5.56%)
Mutual labels:  text
passport
A Kotlin-based Android view validation library with a simple DSL.
Stars: ✭ 31 (-42.59%)
Mutual labels:  text
muse-as-service
REST API for sentence tokenization and embedding using Multilingual Universal Sentence Encoder.
Stars: ✭ 45 (-16.67%)
Mutual labels:  text
nimtesseract
A Tesseract OCR wrapper for Nim
Stars: ✭ 23 (-57.41%)
Mutual labels:  text
blackcrownproject
The archive of The Black Crown Project, a now-dismembered narrative web game.
Stars: ✭ 18 (-66.67%)
Mutual labels:  text
strokeText.js
Simple, pixel-perfect text stroking for the web.
Stars: ✭ 30 (-44.44%)
Mutual labels:  text
arrayfiles
Array-like File Access in Python
Stars: ✭ 41 (-24.07%)
Mutual labels:  text
fql
Formatted text processing with SQL
Stars: ✭ 20 (-62.96%)
Mutual labels:  text
cs paint
Vulkan rendering library for graphics and text
Stars: ✭ 79 (+46.3%)
Mutual labels:  text
imperial
Official mono-repo for https://imperialb.in/
Stars: ✭ 35 (-35.19%)
Mutual labels:  text
STTextView
📝 STTextView is a light-weight library that adds a placeholder to the UITextView.
Stars: ✭ 36 (-33.33%)
Mutual labels:  text
QPrompt
Personal teleprompter software for all video creators. Built with ease of use, productivity, control accuracy, and smooth performance in mind.
Stars: ✭ 168 (+211.11%)
Mutual labels:  text
lt2circuitikz
Python (3.5) tool to convert .asc files into circuiTikz graphics
Stars: ✭ 57 (+5.56%)
Mutual labels:  text
FNet-pytorch
Unofficial implementation of Google's FNet: Mixing Tokens with Fourier Transforms
Stars: ✭ 204 (+277.78%)
Mutual labels:  text
spyql
Query data on the command line with SQL-like SELECTs powered by Python expressions
Stars: ✭ 694 (+1185.19%)
Mutual labels:  text

Svensk text

Svensk text är en samling med data för språkresurser på svenska speciellt anpassat för att snabbt kunna läsas in av vanliga programspråk.

Syftet är att samla svenska resurser som:

  • är fria att använda
  • finns i flera öppna standardiserade format som CSV och JSON
  • har en enkel datastruktur
  • kan enkelt maskinläsas
  • består av små filer utan onödigt krimskrams
  • kan läsas in i bibliotek för R, Python och C#

Alla resurser

Kategori Resurs Antal Beskrivning
Namn Tilltalsnamn 103584 Tilltalsnamn på män och kvinnor i Sverige
Namn Förnamn 163213 Förnamn på män och kvinnor i Sverige
Namn Efternamn 382492 Efternamn i Sverige
Nationaliteter Nationaliteter 197 Nationaliteter med namn på invånarna i landet, både singular och plural
Platser Svenska orter 2007 Namn på svenska orter
Platser Sveriges län 21 Sveriges län
Platser Sveriges kommuner 290 Sveriges kommuner
Platser Länder och huvudstäder 202 Världens länder samt deras huvudstäder
Platser Landskoder 245 Landskoder (ISO 3166-1)
Platser Valutor 245 Länder och deras valutor och valutakoder (ISO 4217)
Platser Vägar 278 Svenska Europavägar, riksvägar och landsvägar
Tider Helgdagar 23 Svenska helgdagar
Tider Tidsperioder 27 Tidsenheter och tidsintervall
Tider Månader 12 Månader januari till december
Tider Veckodagar 7 Veckodagar måndag till söndag
Ord Lemma 675137 Grundformen av ord (t ex "springa" är grundform av "sprungit" och "sprang")
Ord Stoppord 438 Svenska stoppord
Ord Politiska stoppord 285 Svenska politiska stoppord
Ord Sentimentlexikon 2067 Positiva och negativa svenska ord
Ord Emotioner 8519 Känsloladdade ord och deras intensitet, uppdelade på 8 känslor
Ord Moral 2104 Moraliska ord enligt Moral Foundations Theory, uppdelade på 5 fundament
Ord Corona/smitta 594 Lexikon för ord relaterade till corona/smitta i nyhetsmedier
Jobb Yrken 13833 Svenska yrkesbeteckningar inklusive om det är en manlig eller kvinnlig beteckning
Organisationer Medier 158 Domäner till svenska massmedier och nyhetsmedier
Organisationer Myndigheter 354 Namn på svenska myndigheter
Organisationer EU-institutioner 17 Namn på EU:s institutioner och organ
Wikipedia Wikipedia-titlar 6130751 Alla titlar på svenska Wikipedia-sidor

Programbibliotek

Vill du hjälpa till?

Läs mer om hur du kan bidra med CSV-filer med öppen data.

Vill du använda datan? Gör en kopia.

Gör helst en egen lokal kopia. Både datan och strukturen kan nämligen ändras varefter som den utökas.

Citera

Svensk text finns på Svensk nationell datatjänst och kan citeras på följande sätt:

APA6:

Dahlgren, P. M. (2018). Svensk text. Svensk nationell datatjänst. https://snd.gu.se/sv/catalogue/study/ext0278

BibTeX:

@misc{dahlgren_svensktext_2018,
	title = {Svensk text},
	url = {https://snd.gu.se/sv/catalogue/study/ext0278},
	abstract = {Samling med språkresurser på svenska speciellt anpassat för att snabbt och enkelt kunna läsas in av programspråk som Python, R eller dylikt. Bland språkresurserna finns namn på kvinnor (förnamn), män (förnamn), städer, kommuner, län, huvudstäder, länder, nationaliteter, yrken, myndigheter, massmedier med mera. Syftet är att samla svenska resurser som är fria att använda, finns i flera öppna standardiserade format (exempelvis CSV och JSON), har en enkel datastruktur som enkelt kan maskinläsas, består av små filer utan onödigt krimskrams och har exempelkod (R och Python) för att snabbt kunna användas. Materialet utökas och uppdateras kontinuerligt under öppna licenser.},
	language = {Svenska},
	urldate = {2018-12-20},
	publisher = {Svensk nationell datatjänst},
	author = {Dahlgren, Peter M.},
	month = dec,
	year = {2018},
	note = {https://github.com/peterdalle/svensktext}
}

Publikationer som använder datan

Säg gärna till så lägger jag till din publikation här (eller gör det själv genom en pull request).

Se även

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].