مایکروسافت اخیرا یک کتابخانه پایتون به نام MarkItDown منتشر کرده که ابزاری کاربردی برای تبدیل فایلهای مختلف (فایلهای پاورپوینت، پیدیاف، ورد، اکسل و...) به Markdown است.
این موضوع برای تجزیه و تحلیل متون داخل فایلها بسیار کاربردیست.
این کتابخانه در حال حاضر از pdf، پاورپوینت (pptx.)، ورد (.docx)، اکسل (xlsx.)، تصاویر (متادیتای EXIF و OCR)، فایل صوتی (متادیتای EXIF و رونویسی گفتار)، HTML (به خصوص در مورد ویکیپدیا و...) و برخی از سایر فرمتهای مبتنی بر متن مثل csv, json, xml پشتیبانی میکند.
شروع استفاده از این ابزار بسیار سریع و راحت است:
🔗 مشاهده در GitHub
برای درک بهتر کاربرد آن میتوانید از دمویی که یک برنامهنویس خارجی در آدرس زیر قرار داده استفاده کنید:
https://msftmd.replit.app
#Python #library
🆔 @Python4all_pro
این موضوع برای تجزیه و تحلیل متون داخل فایلها بسیار کاربردیست.
این کتابخانه در حال حاضر از pdf، پاورپوینت (pptx.)، ورد (.docx)، اکسل (xlsx.)، تصاویر (متادیتای EXIF و OCR)، فایل صوتی (متادیتای EXIF و رونویسی گفتار)، HTML (به خصوص در مورد ویکیپدیا و...) و برخی از سایر فرمتهای مبتنی بر متن مثل csv, json, xml پشتیبانی میکند.
شروع استفاده از این ابزار بسیار سریع و راحت است:
from markitdown import MarkItDown
markitdown = MarkItDown()
result = markitdown.convert("test.xlsx")
print(result.text_content)
🔗 مشاهده در GitHub
برای درک بهتر کاربرد آن میتوانید از دمویی که یک برنامهنویس خارجی در آدرس زیر قرار داده استفاده کنید:
https://msftmd.replit.app
#Python #library
🆔 @Python4all_pro
Python library that adds Generative AI capabilities to Pandas!
Introducing PandasAI: Analyze complex data frames and plot visualizations just by using natural language:
100% Open Source
With Pandas AI you can:
→ Clean the Data
→ Impute missing values
→ Generate New features
→ Analyze and manipulate the data
you can also ask it to plot the charts
Github Repo: https://github.com/Sinaptik-AI/pandas-ai
#Python #library
🆔 @Python4all_pro
Introducing PandasAI: Analyze complex data frames and plot visualizations just by using natural language:
100% Open Source
With Pandas AI you can:
→ Clean the Data
→ Impute missing values
→ Generate New features
→ Analyze and manipulate the data
you can also ask it to plot the charts
Github Repo: https://github.com/Sinaptik-AI/pandas-ai
#Python #library
🆔 @Python4all_pro
A Python library to query Apple's Find My network, supporting AirTags, iPhones,and other devices with features like location reporting, 2FA, and Bluetooth scanning
https://github.com/malmeloo/FindMy.py
#Python #library
🆔 @Python4all_pro
https://github.com/malmeloo/FindMy.py
#Python #library
🆔 @Python4all_pro
python-sortedcontainers - A library of Python collections that support automatic sorting: SortedList, SortedDict and SortedSet!
🌟 These data structures are implemented in pure Python but provide performance comparable to C libraries. The library stands out for its ease of use, no compilation required, and efficient operations such as insertion, deletion, and lookup that run faster than linear time.
🔐 License: Apache-2.0
🖥 Github
#python #library
🆔 @Python4all_pro
🌟 These data structures are implemented in pure Python but provide performance comparable to C libraries. The library stands out for its ease of use, no compilation required, and efficient operations such as insertion, deletion, and lookup that run faster than linear time.
🔐 License: Apache-2.0
🖥 Github
#python #library
🆔 @Python4all_pro
🖥 Magic Wormhole
Magic Wormhole is a library and command line utility for securely transferring files, folders or text between computers!
🌟 The transfer process is organized using unique “wormhole codes” that are easy to pronounce and entered manually or through auto-completion. These codes are one-time use, which ensures a high level of security.
🔐 License: MIT
🖥 Github
#library #Python
🆔 @Python4all_pro
Magic Wormhole is a library and command line utility for securely transferring files, folders or text between computers!
🌟 The transfer process is organized using unique “wormhole codes” that are easy to pronounce and entered manually or through auto-completion. These codes are one-time use, which ensures a high level of security.
🔐 License: MIT
🖥 Github
#library #Python
🆔 @Python4all_pro
دوره رایگان تحلیل داده ها با پایتون از IBM
در این دوره کار با کتابخانه های NumPy و Pandas را یاد بگیرید
https://cognitiveclass.ai/courses/data-analysis-python
#pandas #Python #library
#علم_داده
🆔 @Python4all_pro
در این دوره کار با کتابخانه های NumPy و Pandas را یاد بگیرید
https://cognitiveclass.ai/courses/data-analysis-python
#pandas #Python #library
#علم_داده
🆔 @Python4all_pro
cognitiveclass.ai
Data Analysis with Python
Learn modern techniques of Data Analysis using Python and popular open-source libraries like pandas, scikit-learn and numpy and transform data into insights.
دوره رایگان مصورسازی داده ها با پایتون از IBM
در این دوره کار با کتابخانه های Matplotlib و Seaborn را یاد بگیرید
https://cognitiveclass.ai/courses/data-visualization-python
#کتابخانه #Python #library
🆔 @Python4all_pro
در این دوره کار با کتابخانه های Matplotlib و Seaborn را یاد بگیرید
https://cognitiveclass.ai/courses/data-visualization-python
#کتابخانه #Python #library
🆔 @Python4all_pro
cognitiveclass.ai
Data Visualization with Python
Data visualization is the graphical representation of data in order to interactively and efficiently convey insights to clients, customers, and stakeholders in general. It is a way to summarize your findings and display it in a form that facilitates interpretation…
Python library that adds interactive dashboards to pandas dataframes for exploring data
https://github.com/Kanaries/pygwalker
#پایتون #Python #library #علم_داده
🆔 @Python4all_pro
https://github.com/Kanaries/pygwalker
#پایتون #Python #library #علم_داده
🆔 @Python4all_pro
🖥 PDF CRAFT-a python library for converting PDF (primarily scanned books) in Markdown and EPUB using local AI models and LLM to structure the contents
Github
Basic possibilities
- extracting text and layout
Uses the combination of Doclayout-Yolo and its own algorithms for detecting and filtering headlines, columns, footnotes and page numbers
- Local OCR
Recognizes the text on the page via Onnxocr, supports acceleration on GPU (CUDA)
- Determining the order of reading
With the help of LayoutReader, it builds a flow of text in the order in which it is perceived by a person
- Converting in Markdown
Generates .MD with relative links to images (illustrations, tables, formulas) in the Assets folder
Installation and requirements
Python ≥ 3.10 (recommended 3.10.16).
Pip Install PDF-Craft and PIP Install Onnxruntime == 1.21.0 (or Onnxruntime-GPU == 1.21.0 for CUDA).
For an EPUB conveier, you need access to the LLM service (for example, Deepseek).
🟡 Github
#پایتون #Python #library
🆔 @Python4all_pro
Github
Basic possibilities
- extracting text and layout
Uses the combination of Doclayout-Yolo and its own algorithms for detecting and filtering headlines, columns, footnotes and page numbers
- Local OCR
Recognizes the text on the page via Onnxocr, supports acceleration on GPU (CUDA)
- Determining the order of reading
With the help of LayoutReader, it builds a flow of text in the order in which it is perceived by a person
- Converting in Markdown
Generates .MD with relative links to images (illustrations, tables, formulas) in the Assets folder
Installation and requirements
Python ≥ 3.10 (recommended 3.10.16).
Pip Install PDF-Craft and PIP Install Onnxruntime == 1.21.0 (or Onnxruntime-GPU == 1.21.0 for CUDA).
For an EPUB conveier, you need access to the LLM service (for example, Deepseek).
🟡 Github
#پایتون #Python #library
🆔 @Python4all_pro