HomeExploreextract

Extract Collection

Repositories tagged with "extract"

RARE

TCG-style cards with ATK/DEF/SPD stats

RARE

⭐9.1kHP

◆

🔮Psychic

★★★

video-subtitle-extractor

YaoFANGUK

Pythondeep-learningextract

“视频硬字幕提取，生成srt文件。无需申请第三方API，本地实现文本识别。基于深度学习的视频字幕提取框架，包含字幕区域检测、字幕内容提取。A GUI tool for extracting hard-coded subtitle (hardsub) from videos and generating srt files. ”

★

9.1k

916

9.1k

916 forks

ATK

DEF

SPD

GitPedia #487

3/5

View wiki →𝕏

GitPedia

Repository Card

RARE

★

9.1k

916

9.1k

RARE

⭐5.5kHP

◆

🔮Psychic

★★★

dlt

dlt-hub

Pythondatadata-engineering

“data load tool (dlt) is an open source Python library that makes data loading easy 🛠️ ”

★

5.5k

530

5.5k

530 forks

ATK

DEF

SPD

GitPedia #789

3/5

View wiki →𝕏

GitPedia

Repository Card

RARE

★

5.5k

530

5.5k

RARE

⭐5.1kHP

◆

🔥Fire

★★★

SwiftSoup

scinfu

Swiftdomextract

“SwiftSoup: Pure Swift HTML Parser, with best of DOM, CSS, and jquery (Supports Linux, iOS, Mac, tvOS, watchOS)”

★

5.1k

390

5.1k

390 forks

ATK

DEF

SPD

GitPedia #392

3/5

View wiki →𝕏

GitPedia

Repository Card

RARE

★

5.1k

390

5.1k

UNCOMMON

⭐4.5kHP

◆

⚡Thunder

★★

pdfsam

torakiki

Javacombineextract

“PDFsam, a desktop application to split, merge, mix, rotate PDF files and extract pages”

★

4.5k

394

4.5k

394 forks

ATK

DEF

SPD

GitPedia #138

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

4.5k

394

4.5k

UNCOMMON

⭐4.4kHP

◆

🌊Water

★★

archiver

mholt

Go7ziparchives

“DEPRECATED. Please use mholt/archives instead.”

★

4.4k

399

4.4k

399 forks

ATK

DEF

SPD

GitPedia #071

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

4.4k

399

4.4k

UNCOMMON

⭐3.7kHP

◆

🔮Psychic

★★

camelot

atlanhq

Pythonextractfor-humans

“Camelot: PDF Table Extraction for Humans”

★

3.7k

360

3.7k

360 forks

ATK

DEF

SPD

GitPedia #606

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

3.7k

360

3.7k

UNCOMMON

⭐3.2kHP

◆

⚡Thunder

★★

Jailer

Wisser

Javadatabasedb2

“Database Subsetting and Relational Data Browsing Tool.”

★

3.2k

140

3.2k

140 forks

ATK

DEF

SPD

GitPedia #591

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

3.2k

140

3.2k

UNCOMMON

⭐3.1kHP

◆

🔮Psychic

★★

text-extract-api

CatchTheTornado

Pythonanonymizationapi

“Document (PDF, Word, PPTX ...) extraction and parse API using state of the art modern OCRs + Ollama supported models. Anonymize documents. Remove PII. Convert any document or picture to structured JSON or Markdown”

★

3.1k

276

3.1k

276 forks

ATK

DEF

SPD

GitPedia #221

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

3.1k

276

3.1k

UNCOMMON

⭐3.1kHP

◆

🔮Psychic

★★

UtinyRipper

mafaca

C#assetassetbundle

“GUI and API library to work with Engine assets, serialized and bundle files”

★

3.1k

439

3.1k

439 forks

ATK

DEF

SPD

GitPedia #875

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

3.1k

439

3.1k

UNCOMMON

⭐2.8kHP

◆

💎Aqua

★★

webcrack

j4k0xb

TypeScriptastbrowserify

“Deobfuscate obfuscator.io, unminify and unpack bundled javascript”

★

2.8k

315

2.8k

315 forks

ATK

DEF

SPD

GitPedia #659

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

2.8k

315

2.8k

UNCOMMON

⭐2.3kHP

◆

⚔️Fighting

★★

earth-reverse-engineering

retroplasma

C3d-modelsclient

“Reversing Google's 3D satellite mode”

★

2.3k

229

2.3k

229 forks

ATK

DEF

SPD

GitPedia #186

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

2.3k

229

2.3k

UNCOMMON

⭐2.1kHP

◆

💎Aqua

★★

pythonVSCode

DonJayamanne

TypeScriptautopep8editor

“This extension is now maintained in the Microsoft fork.”

★

2.1k

1.7k

2.1k

1.7k forks

ATK

DEF

SPD

GitPedia #252

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

2.1k

1.7k

2.1k

UNCOMMON

⭐1.9kHP

◆

⚡Electric

★★

article-extractor

extractus

JavaScriptarticlearticle-extractor

“To extract main article from given URL with Node.js”

★

1.9k

160

1.9k

160 forks

ATK

DEF

SPD

GitPedia #807

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

1.9k

160

1.9k

UNCOMMON

⭐1.8kHP

◆

🔮Psychic

★★

excalibur

camelot-dev

Pythonextractfor-humans

“A web interface to extract tabular data from PDFs”

★

1.8k

237

1.8k

237 forks

ATK

DEF

SPD

GitPedia #159

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

1.8k

237

1.8k

UNCOMMON

⭐1.8kHP

◆

☠️Poison

★★

php-font-lib

dompdf

PHPextractfont

“A library to read, parse, export and make subsets of different types of font files.”

★

1.8k

254

1.8k

254 forks

ATK

DEF

SPD

GitPedia #270

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

1.8k

254

1.8k

UNCOMMON

⭐1.7kHP

◆

🔮Psychic

★★

lessmsi

activescott

C#c-sharpchocolatey

“A tool to view and extract the contents of an Windows Installer (.msi) file.”

★

1.7k

189

1.7k

189 forks

ATK

DEF

SPD

GitPedia #851

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

1.7k

189

1.7k

UNCOMMON

⭐1.6kHP

◆

⚡Thunder

★★

PDFLayoutTextStripper

JonathanLink

Javadata-extractionextract

“Converts a pdf file into a text file while keeping the layout of the original pdf. Useful to extract the content from a table in a pdf file for instance. This is a subclass of PDFTextStripper class (from the Apache PDFBox library).”

★

1.6k

213

1.6k

213 forks

ATK

DEF

SPD

GitPedia #828

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

1.6k

213

1.6k

UNCOMMON

⭐1.5kHP

◆

💎Aqua

★★

vscode-glean

wix-incubator

TypeScriptclean-codeextract

“The extension provides refactoring tools for your React codebase”

★

1.5k

56 forks

ATK

DEF

SPD

GitPedia #331

2/5

View wiki →𝕏

GitPedia

Repository Card

UNCOMMON

★

1.5k