𝐈𝐧𝐟𝐢𝐧𝐢𝐭𝐲 𝐂𝐒
200 subscribers
122 photos
1 video
3 files
34 links
Your daily source for Artificial Intelligence (AI), Machine Learning (ML), Deep Learning, and Computer Science trends. We share coding resources, projects, tech news, and updates.

#Infinitycs
Download Telegram
The biggest change in this new model is that it’s built to work like a "Digital Employee," not just a regular Chatbot.

Anthropic has introduced three main features this time: Effort Parameter, Context Compaction, and Tool Search. Usually, when we ask an AI a question, it just gives a standard answer. But with the Effort Parameter in Opus 4.5, we can decide how long the model should think. If you set it to "High Effort," it thinks much deeper than the old Opus 4.1 to solve coding problems. The amazing thing is, even at "Medium Effort," it performs just as well as the previous Sonnet 4.5 but uses 76% fewer output tokens. That’s a huge win for saving money.

The next most important thing is Context Compaction. We know that with any AI, the "memory" fills up as you keep working, and it forgets what you said at the start. But Opus 4.5 compresses old logs and unnecessary details, keeping only the important stuff in its active memory. Because of this, it can handle coding sessions that last for 30 hours straight. Also, thanks to Tool Search, it can now handle thousands of enterprise tools. It has the ability to search for and find the right tool when needed, just like a human looking up a manual to get work done.

Talking about Benchmarks, Opus 4.5 scored 80.9% on the SWE-bench Verified, which is the industry standard. This is a significant lead over Google Gemini 3 (76.2%) and GPT-5.1 (~76.3%). This isn't just a random number. It shows that Opus 4.5 can now handle bug fixing and feature implementation on its own, just like a Junior Developer. For example, it managed to fix a complex bug in a PostgreSQL extension—something previous models couldn't do—by cloning the repository and checking the internals all by itself.

On the Pricing side, Anthropic has made a big move. The old Opus 4.1 was expensive (around $15 input / $75 output). But the new Opus 4.5 is about 66% cheaper ($5 input / $25 output). Even though it's still a bit pricier than GPT-5.1 ($1.25/$10), Opus 4.5 saves you money in the long run because of its "First-pass reliability." Since it writes the correct code the first time, you don't waste money fixing errors.

In short, Claude Opus 4.5 isn't just another AI update. While Google is focusing on video and fancy features, Anthropic has chosen to focus on Pure Intelligence and Reliability. We can confidently say this is the best tool right now for complex work like Software Engineering and Data Analysis. It’s clear now that by 2026, the world of enterprise software is going to change completely because of these "Agentic" AI models.

@TheInfinityAI
4🔥1
𝐈𝐧𝐟𝐢𝐧𝐢𝐭𝐲 𝐂𝐒
Photo
ඔයා දන්නවද Uncensored LLMs ගැන, අපි හැමෝම වගේ ChatGPT, Claude එහෙමත් නැත්නම් Gemini වගේ AI tools පාවිච්චි කරන්න පුරුදු වෙලානේ ඉන්නේ. හැබැයි ඔයාට කවදා හරි හිතිලා තියෙනවද මේවා හිර වෙලා ඉන්න රාමුවෙන් එළියට ගියොත් මොන වගේ වෙයිද කියලා? අන්න එතනදි තමයි මේ Uncensored LLMs කියන මාතෘකාව කරළියට එන්නේ.

සරලවම කිව්වොත්, මේ මාදිලි හරියට 'බෑ' කියන්න දන්නේ නැති AI එකතුවක් වගේ. දැන් බලන්නකෝ, අපි සාමාන්‍ය ChatGPT එකෙන් ටිකක් මතභේදාත්මක හෝ අනතුරුදායක දෙයක් ගැන ඇහුවොත්, ඒක බොහොම ආචාරශීලීව ඒ ඉල්ලීම ප්‍රතික්ෂේප කරනවානේ. ඒකට හේතුව තමයි ඒවාට දාලා තියෙන Safety Guardrails නැත්නම් ආරක්ෂක වැටවල්. හැබැයි මේ Uncensored models වලට එහෙම කිසිම තහංචියක් නෑ. ඕනෑම දෙයක්, ඕනෑම විදියකට කතා කරන්න මේවා ලෑස්තියි. මේක එක පැත්තකින් භයානකයි වගේ පෙනුනට, පර්යේෂණ කරන අයට සහ නිර්මාණාත්මක දේවල් ලියන අයට නම් මෙය මාරම නිදහසක්.

මේවා නිර්මාණය කරන තාක්ෂණයත් හරිම පුදුම හිතෙන සුළුයි. මේ දවස්වල, ඒ කියන්නේ 2025 වෙද්දි ගොඩක් ජනප්‍රිය වෙලා තියෙන්නේ Abliteration කියන ක්‍රමවේදය. ඒ කියන්නේ අර Llama 3 වගේ ප්‍රබල මොඩල් එකක් අරගෙන, Model එකේ තියෙන refusal mechanism එක (ඒ කියන්නේ එපා කියන්න බල කරන කොටස) mathematically අයින් කරන එක. හරියට නිකන් අපේ මොලේ ඔපරේශන් එකක් කරලා බය කියන දේ අමතක කරවනවා වගේ වැඩක්.

දැන් ඔයාට ප්‍රශ්නයක් එන්න පුළුවන්, මොනවද මේ වෙද්දි තියෙන හොඳම Models කියලා.

Code ලියන්නයි, තර්කානුකූලව හිතන්නයි නම් මේ වෙලාවේ හැමෝම කතා වෙන්නේ Dolphin 3.0 එක ගැන. ඒක Llama 3.1 එක පදනම් කරගෙන හදපු හින්දා හරිම වේගවත් වගේම තියුණුයි. අනික නිර්මාණාත්මක දේවල් ලියන්න කැමති අයට Llama-3.2 Dark Champion එක ගොඩක් හොඳයි.

Images එහෙම හදන්න කැමති නම්, Midjourney එකටත් වඩා ලොකු නිදහසක් Flux.1 එකෙන් ලැබෙනවා. මොකද මේකේ Midjourney වගේ 'Banned Words' ලිස්ට් එකක් නෑ. හිතේ තියෙන ඕනම අදහසක් රූපයක් කරන්න මේකට පුළුවන්. ඒ වගේම දැන් වීඩියෝ හදන අයටත් Wan 2.1 සහ Open-Sora වගේ tools ලොකු වාසියක් වෙලා තියෙනවා, මොකද මේවා ඕනම කෙනෙක්ට තමන්ගේ PC එකේම රන් කරන්න පුළුවන් නිසා.

විශේෂම දේ තමයි, අපේ සිංහල භාෂාව හසුරුවන්න පුළුවන් JOSIEFIED-Qwen3 වගේ මාදිලිත් මේ අතර තියෙන එක. ආසියානු භාෂා එක්ක වැඩ කරන්න මේක හරිම දක්ෂයි.

කොහොම වුණත්, මේ තාක්ෂණය හරිම risky. මේකෙදි අපිට ලැබෙන නිදහස එක්කම ලොකු වගකීමකුත් එනවා. මොකද මේක පාවිච්චි කරන කෙනාගේ අරමුණ මත තමයි ඒක තීරණය වෙන්නේ.

@TheInfinityAI
4🔥2❤‍🔥1🎉1😍1🐳1
MCP Servers (Model Context Protocol) 🧠

​දැන් කාලේ AI ගැන කතා කරනකොට අලුතෙන්ම ඇහෙන, ඒ වගේම වැදගත්ම වචනයක් තමයි MCP නැත්නම් Model Context Protocol කියන්නේ. සරලවම කිව්වොත්, මේක AI ලෝකයේ "Universal Connector" එකක් වගේ.

​අපි පොඩි උදාහරණයක් ගමු. ඔයාගේ Computer එකට Mouse එකක්, Keyboard එකක් හෝ Pen drive එකක් ගැහුවම ඒක වැඩ කරනවා නේද? ඒකට හේතුව තමයි USB තාක්ෂණය. අන්න ඒ වගේ, ඕනෑම AI මොඩල් එකකට (Claude, ChatGPT, Copilot වගේ) අපේ Data හෝ වෙනත් Tools එක්ක ලේසියෙන් සම්බන්ධ වෙන්න හදපු ක්‍රමයක් තමයි MCP කියන්නේ.

​ඇයි අපිට MCP ඕන වෙන්නේ? 🌎

​සාමාන්‍යයෙන් AI මොඩල් එකක් වැඩ කරන්නේ තනියම. ඒකට කෙලින්ම ඔයාගේ Computer එකේ තියෙන Files බලන්නවත්, Company Database එකට ලොග් වෙන්නවත් බැහැ. ​උදාහරණයකට, ඔයා VS Code එකේ ඉන්න ගමන් Copilot ගෙන් ඇහුවොත් "මගේ අලුත්ම GitHub Issue එක මොකක්ද?" කියලා, සාමාන්‍යයෙන් ඒකට උත්තර දෙන්න බැහැ. මොකද Copilot දන්නේ කෝඩ් ලියන්න විතරයි. ඔයාගේ GitHub Account එක ඇතුලේ වෙන්නේ මොනවද කියලා ඒක දන්නේ නෑ. ​අන්න එතනට තමයි MCP එන්නේ.

VS Code Copilot සහ MCP:

​මේක හොඳටම පැහැදිලි කරගන්න පුළුවන් අපිට නිතරම හම්බවෙන VS Code Copilot එකත් එක්ක.
​අපි Copilot එකට MCP එකක් හරහා අපේ tools සම්බන්ධ කරාම, Copilot නිකන්ම "Chatbot" කෙනෙක් වෙලා ඉන්නේ නෑ. එයා වැඩ කරන්න පුළුවන් "Agent" කෙනෙක් වෙනවා. ​හිතන්න ඔයා VS Code එකට GitHub MCP Server එක සම්බන්ධ කළා කියලා. එතකොට වෙන්නේ මෙන්න මේ වගේ දේවල්:

🟢 Issues බලන්න පුළුවන් - ඔයාට Copilot Chat එකේ කෙලින්ම අහන්න පුළුවන් "Find bugs reported today" කියලා. එතකොට Copilot කෙලින්ම GitHub එකට connect වෙලා ලිස්ට් එක අරන් දෙනවා.
🟢 Database එක්ක කතා කරන්න - ඔයා "Postgres MCP Server" එකක් දැම්මොත්, Copilot ට පුළුවන් ඔයාගේ Database එකේ තියෙන Table structure එක බලලා, ඒකට හරියන Queries ලියලා දෙන්න විතරක් නෙවෙයි, ඕන නම් Data ටික අරන් පෙන්නන්නත් පුළුවන්.
🟢Commands Run කරන්න - Terminal එකේ ගහන්න ඕන Commands පවා Copilot ලවාම Run කරගන්න පුළුවන් වෙනවා.

​සරලවම කිව්වොත්, MCP නිසා Copilot ට ඇස් සහ අත් ලැබෙනවා වගේ වැඩක් වෙන්නේ. එයාට දැන් ඔයාගේ කෝඩ් එක දිහා බලන් ඉන්නවා වගේම, පිටින් තියෙන Tools (GitHub, Slack, Database) එක්කත් වැඩ කරන්න පුළුවන්.

MCP එක වැඩ කරන්නේ කොහොමද? ​මේකේ ප්‍රධාන කොටස් 3ක් තියෙනවා

1️⃣ MCP Host (AI App) - මේක තමයි⠀ප්‍රධාන මෘදුකාංගය. ( vs code එකේ Copilot Chat එක).
2️⃣ ​MCP Server (The Tool) - මේක තමයි අපේ Data තියෙන තැන. (උදා: GitHub API එකට කතා කරන පොඩි server එකක්, නැත්නම් අපේ Local Files කියවන server එකක්).
3️⃣ ​MCP Client - මේ දෙක යා කරන පාලම.

​ඇයි මේක Developers ලට සහ අපිට වැදගත්? ​🚀

🐞 එක පාරයි හදන්න ඕන - Developers ලට දැන් හැම AI එකකටම (Claude, ChatGPT, Gemini) වෙන වෙනම tools හදන්න ඕන නෑ. එක MCP Server එකක් හැදුවම ඒක ඕනම AI එකක් එක්ක වැඩ කරනවා.
🐞 ​Data Security - අපේ සම්පූර්ණ Database එකම AI Company එකට යවන්න ඕන නෑ. අපේ මැෂින් එකේ දුවන MCP Server එක හරහා, අවශ්‍ය දේ විතරක් AI එකට පෙන්නන්න පුළුවන්.

​MCP කියන්නේ AI තාක්ෂණයේ ලොකු පිම්මක්. විශේෂයෙන්ම VS Code වගේ පරිසරයකදී, නිකන්ම කෝඩ් ජෙනරේට් කරනවාට වඩා, අපේ මුළු Project එකම මැනේජ් කරන්න පුළුවන් මට්ටමට AI එක දියුණු කරන්න මේ MCP තාක්ෂණය උදව් වෙනවා. ​කෙටියෙන්ම MCP කියන්නේ Copilot වගේ AI වලට, ඔයාගේ GitHub, Database සහ Files එක්ක කෙලින්ම ගනුදෙනු කරන්න දෙන "Identity Card" එක වගේ දෙයක්! 🧠

✍️ @TheInfinityAI
Please open Telegram to view this post
VIEW IN TELEGRAM
3❤‍🔥1🔥1🎉1👨‍💻1
Media is too big
VIEW IN TELEGRAM
අද අපි කතා කරමු Microsoft ලා ළඟදී (Ignite 2025 ඉවෙන්ට් එකේදී) එළියට දාපු අලුත්ම Database Technology එකක් ගැන. ඒ තමයි Azure HorizonDB. 🖥


මොකක්ද මේ Azure HorizonDB?


මේක හදලා තියෙන්නේ අපි හැමෝම දන්න PostgreSQL පාවිච්චි කරලා, හැබැයි ඒක සාමාන්‍ය විදිහට නෙවෙයි, Microsoft ලගේ අලුත්ම Cloud Technologies එක්ක එකතු කරලා හදපු Database Service එකක් තමයි මේක. මේක හදලා තියෙන්නේ High Performance සහ Massive Scale වැඩ වලට. ඒ කියන්නේ ඔයාගේ App එකට දවසකට ලක්ෂ ගාණක් Users ලා ආවත්, Database එක හිර වෙන්නේ නැතුව දුවන්න මේක හදලා තියෙනවා.


මේකේ තියෙන විශේෂ දේවල් මොනවද?


Performance & Scale - සාමාන්‍ය PostgreSQL එකකට වඩා 3 ගුණයක් (3x) වේගවත් කියලා තමයි Microsoft ලා කියන්නේ. ඒ වගේම මේකේ Storage එක 128TB වෙනකම් වැඩි කරගන්න පුළුවන්. හිතන්නකෝ Data කොච්චර දාන්න පුළුවන්ද කියලා!

Built for AI - දැන් කාලේ හැම ඇප් එකකටම AI ඕනනේ. HorizonDB එකේ Vector Search (DiskANN) ඉබේම එනවා. ඒ කියන්නේ ඔයාට වෙනම Vector Database පාවිච්චි කරන්න ඕන නෑ. ඔයාගේ සාමාන්‍ය Data සහ AI Embeddings එකම තැනක තියාගන්න පුළුවන්.

Cloud-Native Architecture - මේකේ "Compute" (Database එකේ මොළය) සහ "Storage" (Data තියෙන තැන) වැඩ කරන්නේ වෙන වෙනම. ඒ නිසා Data ගොඩක් තිබුණත් Database එක ස්ලෝ වෙන්නේ නෑ. ඕන වෙලාවක ලේසියෙන්ම Scale කරන්න පුළුවන්.


මේක කාටද හොඳ?


Large Scale Project වලට - ඔයා හදන්නේ Uber, Pickme වගේ ලොකු සිස්ටම් එකක් නම්, මේක තමයි හොඳම තේරීම.

AI Apps හදන අයට - RAG වගේ Technologies පාවිච්චි කරලා Chatbots හදන අයට මේක මාරම ලේසියි. මොකද Data සහ Vector Search එකම තැනක තියෙන නිසා.

Postgres Lovers - ඔයා දැනටමත් Postgres වලට පුරුදු වෙලා නම්, අලුතෙන් ඉගෙන ගන්න දෙයක් නෑ. පරණ SQL දැනුමම පාවිච්චි කරලා මේකේ වැඩ කරන්න පුළුවන්.


ඇත්තටම කිව්වොත් Microsoft ලා මේක ගෙනාවේ AWS Aurora සහ Google AlloyDB එක්ක හැප්පෙන්න. කෙටියෙන්ම කියනවා නම් Azure HorizonDB කියන්නේ ඔයාගේ App එක ලොකු වෙනකොට, Database එක ගැන බය නොවී වැඩේ කරගෙන යන්න Microsoft ලා දීපු විසඳුමක්. විශේෂයෙන්ම AI වැඩ වලට මේක මාර වටිනවා.

#AzureHorizonDB #MicrosoftAzure #PostgreSQL #CloudDatabase

@TheInfinityAI
Please open Telegram to view this post
VIEW IN TELEGRAM
21🎉1😍1
.NET (dot net) කියන්නේ simple framework එකක් නෙමෙයි. ඒක Microsoft backed, open-source, cross-platform, enterprise-grade development ecosystem එකක් — modern software engineering needs cover කරන complete platform එකක්.

Why We Use .NET (Other Platforms වලට වඩා විශේෂ ඇයි?)
1. Enterprise Trust & Stability
.NET widely used වෙනවා:
- Banking systems
- Government platforms
- Healthcare & ERP solutions
Reason: Long-term support (LTS), security updates, backward compatibility

2. Performance Without Complexity
Node.js / Python වගේ platforms වල high-performance handle කරන්න extra tuning අවශ්‍ය වෙද්දී,
.NET gives high performance by default.
- JIT & Native AOT
- Async / Await built into language
- Optimized memory management (GC)
Less effort, more speed

3. Strong Type System = Fewer Bugs
C# is strongly typed.
- Compile-time error detection
- Better IDE support
- Safer refactoring
Compared to dynamically typed platforms,
.NET projects become more stable & maintainable.

4. One Platform, Many App Types
Other ecosystems usually focus on one domain.
But .NET allows:
- Web (ASP.NET)
- Mobile (MAUI)
- Desktop (WPF / WinForms)
- Cloud & Microservices
- Games (Unity)
Single skillset, multiple career paths

5. Built-in Architecture & Best Practices
.NET gives:
- Dependency Injection
- Middleware pipeline
- Logging & configuration
- Security frameworks
Other platforms වල external libraries hunt කරන්න වෙනකොට,
.NET gives batteries included approach.

6. Cloud-Native & DevOps Ready
.NET integrates seamlessly with:
- Azure
- Docker & Kubernetes
- CI/CD pipelines
Perfect for modern cloud-based systems

7. Open Source + Microsoft Backing
Unlike many proprietary platforms:
- .NET is fully open-source
- Governed by the .NET Foundation
- Backed by Microsoft engineering & enterprise experience
Best of both worlds: Community + Corporate stability

.NET Runtime (Advanced Insight)
.NET applications run on CLR (Common Language Runtime):
- Memory management
- Garbage collection
- Threading & async execution
- Runtime security
Developers focus on business logic, not OS-level complexity.

* Final Thought
We choose .NET not just because it works — but because it scales, performs, and survives long-term enterprise demands.
Why .NET Is a Smart Career Choice
- High-demand skill
- Enterprise & cloud relevance
- Cross-platform flexibility
- Long-term ecosystem stability

🙂 .NET free course
https://learn.microsoft.com/en-us/training/dotnet/?wt.mc_id=studentamb_479284

#DotNet #CSharp #BackendDevelopment #EnterpriseSoftware #CloudComputing
Please open Telegram to view this post
VIEW IN TELEGRAM
1
භෞතික විද්‍යාවෙන් උපන් කෘතිම බුද්ධිය (ANN සඳහා නොබෙල් ත්‍යාගය හිමිවූයේ ඇයි?)


​2024 වසරේ භෞතික විද්‍යාව සඳහා වූ නොබෙල් ත්‍යාගය පිරිනමන්නේ ජෝන් හොප්ෆීල්ඩ් (John Hopfield) සහ ජෙෆ්රි හින්ටන් (Geoffrey Hinton) යන විද්වතුන් දෙපළට. පරිගණක විද්‍යාව ට අදාළ යැයි බොහෝ දෙනා සිතන "කෘතිම ස්නායු ජාල" (Artificial Neural Networks - ANN) සඳහා භෞතික විද්‍යා නොබෙල් ත්‍යාගය හිමිවීම බොහෝ දෙනෙක් පුදුමයට පත් කළ කරුණක්.
​ඒත් ඒකට බලපාපු ප්‍රධානතම හේතුව වෙන්නේ අද අප භාවිතා කරන දියුණු AI තාක්ෂණය ගොඩනැගීමට ඔවුන් භෞතික විද්‍යාවේ මූලධර්ම (Physics Principles) භාවිතා කිරීම.

පලවෙනි මාතෘකාව "Spin Glass Systems සහ Hopfield Networks"

2024 නොබෙල් ත්‍යාගය Physics වලින් AI වලට ලැබුණේ ඇයි කියලා බැලුවොත්, ඒකේ ලොකු ක්‍රෙඩිට් එකක් යන්න ඕන John Hopfield ට. එයා කරපු දේ හරිම පුදුම හිතෙන වැඩක්. එයා කළේ භෞතික විද්‍යාවේ තියෙන Spin Glass Systems කියන සංකල්පය පාවිච්චි කරලා, පරිගණකයකට මිනිස් මොළේ වගේ Associative Memory එකක් හදපු එක.

​අපි බලමු මේක වෙන්නේ කොහොමද කියලා.

1. මොකක්ද මේ Spin Glass කියන්නේ?

​Physics වලදී අපි දන්නවා කාන්දම් (Magnets) හැදෙන්නේ පරමාණු (Atoms) වල තියෙන Spins එක පැත්තකට පෙළ ගැසීමෙන් කියලා. සාමාන්‍ය කාන්දමක මේ Spins ඔක්කොම හරිම පිළිවෙලයි (Orderly). ​නමුත් Spin Glass කියන්නේ විශේෂ ලෝහ වර්ගයක් (Alloy). මෙතනදී පරමාණු පිහිටලා තියෙන්නේ Random විදියට. මේ නිසා ඇතුලේ තියෙන Spins වලට ලොකු ප්‍රශ්නයක් එනවා.
- ​සමහර Spins එයාගේ අසල්වැසියා එක්ක එකඟ වෙන්න බලනවා (Align).
- ​තවත් සමහර Spins එයාගේ අසල්වැසියාට විරුද්ධ වෙන්න බලනවා (Anti-align).

​මේ නිසා මේ සිස්ටම් එක ඇතුලේ ලොකු ගැටුමක් ඇති වෙනවා. මේකට Physics වල කියන්නේ Frustration කියලා. මේ Frustration එක නිසා මේ සිස්ටම් එකේ Energy එක වැඩි වෙනවා. සොබාදහමේ නියමයන් අනුව ඕනෑම සිස්ටම් එකක් ට්‍රයි කරන්නේ එයාගේ Energy එක අඩු කරගෙන Stable Equilibrium එකකට එන්න. ඉතින් මේ Spin Glass එකේ Spins ටික එහා මෙහා වෙවී පොරබදමින් අන්තිමට අඩුම ශක්තියක් තියෙන (Low Energy) තැනක ස්ථාවර වෙනවා.

2. Hopfield Network එක වැඩ කරන හැටි

​John Hopfield මේ කන්සෙප්ට් එක කෙලින්ම Artificial Neural Networks වලට ඇප්ලයි කළා.
- ​Atoms/Spins = Neurons: එයා නියුරෝන ගත්තේ 1 හෝ 0 (On/Off) විදියට.
- ​Interactions = Weights: පරමාණු අතර තියෙන බලය, නියුරෝන අතර තියෙන සම්බන්ධතා (Connections) විදියට ගත්තා.

​එයා හදපු මැතමැටිකල් මොඩල් එකේ තියරිය මේකයි:

"අපි නෙට්වර්ක් එකට යම් Pattern එකක් (උදා: පින්තූරයක්) සේව් කළාම ඒක සිස්ටම් එකේ Energy Landscape එකේ තියෙන ගැඹුරු වළක් (Valley) වගේ පිහිටනවා." ​ඔයා මේ සිස්ටම් එකට අසම්පූර්ණ පින්තූරයක් (Input with Noise) දුන්නොත් ඒක හරියට කඳු මුදුනක ඉඳන් බෝලයක් අතහැරියා වගේ වැඩක්.

- ​Input එක දුන්න ගමන් සිස්ටම් එකේ Energy එක High වෙනවා.
- ඊට පස්සේ Hopfield ගේ රූල් එක අනුව නියුරෝන Update වෙමින්, Energy එක අඩු කරගන්න ට්‍රයි කරනවා (Energy Minimization).
- ​අන්තිමට අර බෝලේ පෙරළිලා ගිහින් ළඟම තියෙන වළට (Local Minimum) වැටෙනවා.
- ​අන්න ඒ වළේ තියෙන්නේ අපි කලින් සේව් කරපු Original Image එක.

ඒක නිසා, ​Hopfield Network එක තමයි ලෝකයේ මුලින්ම පෙන්නුවේ Physics වල තියෙන Energy Dynamics පාවිච්චි කරලා පරිගණකයකට දේවල් මතක තියාගන්න පුළුවන් බව (Content-Addressable Memory). අපිට දෙයක් අඩුවෙන් මතක් වුණාම (උදා: සින්දුවක තාලේ විතරක් මතක් වුණාම), මුළු සින්දුවම මතක් කරගන්න අපේ මොළේ වැඩ කරන. විදිය ගණිතමය වශයෙන් ඔප්පු කරපු තැන තමයි මේක.

ඔන්න දැන් තමා දෙවෙනි මාතෘකාව, "Boltzmann Machines සහ Statistical Mechanics".

Artificial Intelligence අද තියෙන තැනට එන්න ලොකුම හේතුවක් තමයි Geoffrey Hinton. එයා 2024 නොබෙල් ත්‍යාගය දිනාගත්තේ AI තාක්ෂණයට Statistical Mechanics (සංඛ්‍යානමය යාන්ත්‍ර විද්‍යාව) එකතු කරපු නිසා. මේ ආටිකල් එකෙන් අපි බලමු කොහොමද 19 වන සියවසේ Physics තියරියක්, 21 වන සියවසේ AI වලට පදනම දැම්මේ කියලා.

1. ​මොකක්ද තිබ්බ ප්‍රශ්නය?

​මුල් කාලේ තිබ්බ Neural Networks වල ලොකු අවුලක් තිබුණා. අපි හිතමු සිස්ටම් එකක් යම් ගැටලුවකට උත්තරයක් හොයනවා කියලා. මේක හරියට කඳු සහිත ප්‍රදේශයක තියෙන බෝලයක්, පල්ලෙහාම තියෙන ගැඹුරුම වළ (Best Solution / Global Minimum) හොයාගෙන යනවා වගේ වැඩක්.
​හැබැයි ප්‍රශ්නේ තමයි මේ බෝලේ යන අතරමග තියෙන පොඩි වළක (Local Minimum) හිර වෙන්න පුළුවන්. එතනින් එහාට ඒකට යන්න බැරි වෙනවා. ඒ කියන්නේ AI එක වැරදි උත්තරයක් ළඟ හිරවෙනවා.

2. මොකද්ද මේකට විසදුම? (Statistical Mechanics සහ Boltzmann Distribution)
Hinton මේකට විසඳුම ගත්තේ වායු අංශු (Gas Particles) අධ්‍යයනය කරන Statistical Mechanics වලින්. Ludwig Boltzmann කියන විද්‍යාඥයා හොයාගත්තා වායු අංශු හැසිරෙන විදිය එකින් එක බලන්න බැරි වුණාට, Probability (සම්භාවිතාව) පාවිච්චි කරලා මුළු සිස්ටම් එකම ගැන කියන්න පුළුවන් කියලා. ​Hinton හැදුවා Boltzmann Machine කියලා අලුත් නෙට්වර්ක් එකක්. එයා මේකට පාවිච්චි කළේ Simulated Annealing කියන කන්සෙප්ට් එක.

- ​ලෝහයක් රත් කළාම (Heat) ඒකේ පරමාණු වේගයෙන්, Randomly දුවනවා.
- ​ලෝහය හෙමින් සිසිල් කරනකොට (Cooling), පරමාණු ලස්සනට ස්ථාවර වෙලා ශක්තිමත් වෙනවා.

3. Stochastic Process එක (අහඹු බව භාවිතා කිරීම)

​Hinton ගේ මේ මොඩල් එකේදී එයා නෙට්වර්ක් එකට මුලින්ම "High Temperature" එකක් දෙනවා. ඒ කියන්නේ නෙට්වර්ක් එකේ තීරණ ගොඩක් දුරට Random / Stochastic වෙනවා.

- ​මෙහෙම Random වෙනකොට, අර බෝලේ පොඩි වළක (Local Minimum) හිරවෙලා හිටියත්, අර ලැබෙන "ශක්තිය" (Noise) නිසා ඒ වළෙන් එළියට විසි වෙනවා.
- ​ඊට පස්සේ හෙමින් Temperature එක අඩු කරනවා.
- ​එතකොට සිස්ටම් එක ටික ටික ස්ථාවර වෙලා, තියෙන ගැඹුරුම වළ (Global Minimum) හොයාගන්නවා.

4. ​Hidden Units සහ Generative AI

​Boltzmann Machine එකේ තිබ්බ වැදගත්ම දේ තමයි Hidden Units.
- ​Visible Units: අපිට පෙනෙන දත්ත (Input Data).
- ​Hidden Units: දත්ත වල තියෙන සංකීර්ණ සම්බන්ධතා (Features) ඉගෙන ගන්නා කොටස.

​මේ Hidden Units වලට පුළුවන් වුණා දත්ත නිකන්ම කටපාඩම් කරන්නේ නැතුව, දත්ත වල Probability Distribution එක ඉගෙන ගන්න. ඒ නිසා මේ මැෂින් එකට පුළුවන් වුණා කලින් දැකපු නැති අලුත් දත්ත නිර්මාණය කරන්න.

​අද අපි දකින ChatGPT, Midjourney වගේ Generative AI වලට "අලුත් දේවල් හිතන්න" පුළුවන් වෙලා තියෙන්නේ Hinton එදා මේ Statistical Mechanics මූලධර්ම AI වලට ගෙනාපු නිසයි. එයා පෙන්නුවා AI එකක් කියන්නේ හුදෙක් Logic ගේම් එකක් නෙවෙයි, ඒක Probabilistic (සම්භාවිතාව මත පදනම් වූ) සිස්ටම් එකක් කියලා. එහෙම බැලුවාම ඇත්තටම AI කියන්නෙත් physics වලින්ම ඉපදුනු තවත් කොටසක් විතරයි 🌝🩶

✍️@TheInfinityAI
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥2❤‍🔥1🎉1💯1
Hands-On AI_ RAG using LlamaIndex Part 01 to Part 04

Part 01:
https://t.me/AIMLDeepThaught/959
Part 02:
https://t.me/AIMLDeepThaught/967
Part 03:
https://t.me/AIMLDeepThaught/975
Part 04:
https://t.me/AIMLDeepThaught/979

1. Introduction


01. Overcome the limitations of LLMs with RAG
02. Limitations of LLMs
03. Use cases for retrieval-augmented generation RAG

2. Getting Started


01. Using GitHub Codespaces
02. Setting up your environment
03. Choosing an LLM and embeddings provider
04. Setting up LLM accounts
05. Choosing a vector database
06. Setting up a Qdrant account
07. Downloading our data

3. Fundamental Concepts in LlamaIndex


01. How LlamaIndex is organized
02. Using LLMs
03. Loading data
04. Indexing
05. Storing and retrieving
06. Querying
07. Agents

Hands-On AI_ RAG using LlamaIndex Part 02

4. Introduction to RAG


01. Components of a RAG system
02. Ingestion pipeline
03. Query pipeline
04. Prompt engineering for RAG
05. Data preparation for RAG
06. Putting it all together
07. Drawbacks of Naive RAG

5. RAG Evaluation


01. Introduction to RAG evaluation
02. Evaluation metrics
03. How to create an evaluation set

Hands-On AI_ RAG using LlamaIndex - Part 03

5. Advanced RAG Pre-Retrieval and Indexing Techniques


01. How we can improve on Naive RAG
02. Optimizing chunk size
03. Small to big retrieval
04. Semantic chunking
05. Metadata extraction
06. Document summary index
07. Query transformation

6. Advanced RAG Post-Retrieval and Other Techniques


01. Node post-processing
02. Re-ranking
03. FLARE
04. Prompt compression
05. Self-correcting

Hands-On AI_ RAG using LlamaIndex - Part 04

7. Modular RAG


01. Hybrid retrieval
02. Agentic RAG
03. Ensemble retrieval
04. Ensemble query engine

8. Conclusion


01. LlamaIndex evaluation
02. Comparative analysis of retrieval-augmented generation technique
2🐳2🎉1
Google has announced the discontinuation "Dark Web Report" feature ⛔️⛔️

Google has confirmed it will shut down its Dark Web Report feature with the transition beginning in January 2026. The tool, which scanned the dark web for leaked user data like emails and phone numbers, is being retired because Google found that it often failed to provide "helpful next steps" once a breach was found. 💳📍🖥

🗓 The Shutdown Timeline:

Jan 15, 2026: Google stops scanning for new leaks. ⚠️
Feb 16, 2026: The feature and all your data are deleted. 🗑

✍️ @TheInfinityAI
Please open Telegram to view this post
VIEW IN TELEGRAM
2🎉2🔥1😍1🎃1🎄1👾1
This media is not supported in your browser
VIEW IN TELEGRAM
🤣3🐳1🍾1
What is the RAG (Retrieval-Augmented Generation) 🔥😳

Think, you are writing an exam. We usually write exams based on what we have memorized. But RAG is like an open book exam. It means we will write the exam using the resources on time, not based on our memory. just like writing answers to the question using a book.

AI models like ChatGPT (actually LLMs) can answer based on their training data set. They cannot provide answers beyond their training data. After integrating the RAG technology, AI models can provide answers by accessing the new outside databases or documents. It will be more accurate than the common answers that return from the LLMs.

Why RAG?
🤔🤔

AI models (LLMs) like ChatGPT and Gemini are brilliant, but they have some limitations,

1. Outdated Data - they trained on past data, because they have no idea about on time information. So they do predict. (Knowledge Cutoff)
2. Hallucinations - sometimes they provide random answers instead of the correct answer.
3. Personal Data - general AI models have no idea about your personal information, like private details or company information.

We can completely mitigate these issues using RAG. How does it work?

This entire process is done through 4 steps,

1. asking a question - think you are asking "can i get a leave?"
2. Retrieve (search) - The AI model (RAG integrated) does not provide the answer directly; it will search your company's HR policies and regulations.
3. Augmented - then the system will collect your problem and the company information and send it to the AL model.
4. generation - now, the AI model is providing an accurate answer after analysing your question with your company details.


Advantages of RAG, 😮😮

👉Low cost - no need to train an AI model from scratch
👉Real-time information - if you ask for real time news, you can get answers if they exist in the databases
👉Stopping hallucination - because the AI model will generate answers based on provided real information.
👉Sources - The AL model can highlight references based on the provided documents or databases.

As a summary, the RAG(Retrieval-Augmented Generation) is like a bridge between your data and a separate AI model like ChatGPT. We can get highly accurate answers from AI models, providing our information as an outside data source. 👍👍

✍️ @TheInfinityAI
Please open Telegram to view this post
VIEW IN TELEGRAM
4❤‍🔥111🔥1🎉1🏆1🎃1🎄1
This media is not supported in your browser
VIEW IN TELEGRAM
2👾3
Welcome to the complete series of articles on machine learning. 👍💃
Please open Telegram to view this post
VIEW IN TELEGRAM
Friends, we all heard about AI (Artificial Intelligence), right? But the basis of all this is Machine Learning (ML). Many people think that this is a very difficult thing, something that is only about math. However, what we hope to learn from this article series is that we can learn ML in everyday language, simply.

Let's learn this in several steps. Today we will start with Phase 1 "The Foundations of ML" as he 1st step.

Phase 1: (The Foundations) 🏗

We must have a strong foundation for every building. Like that, we should know about several basics before starting the ML. We are discussing that things through this article.

01. What is the ML? (the big picture)

Simply, in common computer programming, we are providing data after writing a code, and the code will provide an output. But the ML is doing the opposite. We provide data and the answer. Then the computer figures out on its own how that answer came about. Finally, it creates a "model."

ML have 3 main types,
- Supervised Learning
- Unsupervised Learning
- Reinforcement Learning

02. Need Maths?

Don't worry, the ML is not complex, but some maths parts are important, like.
- Linear Algebra
- Calculus
- Statistics

03 . Data is the Fuel of ML

We cannot expect the correct decisions without accurate data. we should process data before inputting it into the ML models.
- EDA (Exploratory Data Analysis)
- Data cleaning
- Feature engineering

These are the basics of our ML journey. If you study those things, you can easily understand the future articles of this series.

✍️ @TheInfinityAI
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍1
ML series - Chapter 01 | linear regression
Today, we will discuss an easy but powerful algorithm, which is Regression. Earlier, we discussed Supervised Learning. The regression is a Supervised Learning ML algorithm, which predicts numbers.

What is Regression

Think, you are going to build your dream house. When the square feet of the house increase, the price also increases. In regression, we find the connections between those things.

What is linear regression?

This is the basic concept in regression. In this, we write a line (best-fit line) through our data points. As an example,

• A student got 40 marks who worked 2 hours.
• A student got 60 marks who worked 12 hours.
• A student got 90 marks who worked 2 days.

Linear Regression can find the answer to such a question.

Can you remember the school maths?

We learned about the Equation of a straight line in school. The same thing is used in this. (y = mx + c)
• y = the value that we are looking for (exam score).
• x = the data we already know (hours).
• m = the slope of the line.
• c = the points, whre the line starts.

When we are training a model, we are using a model to find the best values of m and c for our data.

How does the machine correct errors? (Cost Function)

The line the machine first draws sometimes does not go exactly through the data. Now there is a simple error occurring (notable error with a large dataset). We are using the Mean Squared Error (MSE) method to measure this error. Actually, in the MSE, we find the difference between the real value and the value provided by the machine. The machine tries every time to reduce this MSE. Because if MSE is low, our prediction is accurate.

Where is Regression used?

• Stock Market - Predict tomorrow's stock market prices.
• Real Estate - Determine the prices of houses and land.
• Business - See what sales will be next month.

Python example for Linear Regression
import numpy as np
from sklearn.linearmodel import LinearRegression

Xhours = [[2], [5], [1], [3], [6]]
ymarks = [40, 70, 20, 50, 80]

model = LinearRegression()
model.fit(Xhours, ymarks)

newhours = [[4]]
predictedmark = model.predict(newhours)

print(f"Points for 4 hours: {predicted_mark[0]:.2f}")


I hope you got a basic idea about Regression from today's article. Remember, here we are guessing "Values". In the next article, we will talk about how to find out what category something belongs to (Classification).

✍️ @TheInfinityAI
3🔥1
🎄 Merry Christmas from Infinity CS!

May your holidays be bug-free, joyful, and full of inspiration.


Infinity CS | CS / AI / ML

@TheInfinityAI
7
🎓 BSc Honours in Computer Engineering. Shape your future in technology with the Faculty of Engineering Technology – The Open University of Sri Lanka

📌 A/L Maths Stream Only
📌 Strong academic foundation
📌 Industry-relevant skills
📌 Recognized degree


🗓 Closing Date: 31st January 2026
👉 Apply Now
📞 011 288 1399 / 070 206 7058
🌐 www.ou.ac.lk


#BScHonours #ComputerEngineering #OUSL #EngineeringEducation #ApplyNow

@TheInfinityAI
2🔥1