리포트 공감능력📂
2K subscribers
1.87K photos
52 videos
50 files
5.92K links
내가 반말 좀 칠게
꼬우면 나가쟈

⭐️손실 책임 없다.
반말까는데 내 말들 사람 있냐.
Download Telegram
차원의 저주는 고차원 공간에서 데이터 분석에 사용되는 샘플 데이터의 수가 상대적으로 적어서 예측 성능이 저하되는 문제입니다. 이를 이해하기 위해 수학적인 개념에 대해 자세히 살펴보겠습니다.

고차원 공간에서 데이터의 밀도는 차원의 증가와 함께 급격하게 감소합니다. 이는 데이터 포인트 간의 거리가 멀어지고, 이웃하는 데이터 포인트들이 서로 상관관계가 적어지기 때문입니다. 이러한 거리와 상관관계의 감소는 분류, 회귀 등의 예측 모델링에서 예측 오차를 증가시키는 원인이 됩니다.

수학적으로 이를 이해하기 위해서는 벡터 공간을 이해해야 합니다. 벡터 공간은 n차원의 실수 공간입니다. 예를 들어, 3차원 벡터는 (x, y, z)와 같은 형태로 나타낼 수 있습니다. 고차원 공간에서의 데이터는 이와 같이 n차원 벡터로 표현됩니다.

데이터의 차원이 증가함에 따라 공간의 크기가 기하급수적으로 증가합니다. 예를 들어, 3차원 공간에서 1씩 증가하는 크기의 정사각형이 4개 필요하다면, 4차원 공간에서는 16개, 5차원 공간에서는 64개의 정사각형이 필요합니다. 이러한 이유로 고차원 공간에서는 데이터 포인트 간의 거리가 멀어지는 경향이 있으며, 이는 예측 성능을 저하시키는 원인이 됩니다.

따라서 데이터 분석에서는 차원의 저주를 고려하여 적절한 차원 축소, 피처 선택, 피처 추출 등의 방법을 활용하여 데이터 분석의 정확도와 속도를 향상시켜야 합니다.

이를 빅데이터 분야에 적용하면, 빅데이터에서 발생하는 차원의 증가로 인해 데이터 분석의 정확도와 속도가 저하될 수 있습니다. 따라서 차원의 저주를 해결하는 방법이 필요합니다.

빅데이터 분야에서 차원의 저주를 해결하는 방법은 다음과 같습니다.

차원 축소: 차원을 축소하여 데이터를 더욱 밀도있게 만듭니다. 이를 통해 예측 성능을 향상시킬 수 있습니다.

피처 선택: 데이터에서 중요한 피처를 선택하여 분석에 활용합니다. 이를 통해 차원을 줄일 수 있으며, 분석 시간을 단축시킬 수 있습니다.

피처 추출: 원본 데이터에서 새로운 피처를 추출합니다. 예를 들어, 이미지 데이터에서 SIFT, SURF, HOG와 같은 feature extraction 방법을 사용하여 이미지를 표현하고 분석합니다.

클러스터링: 비슷한 데이터를 하나의 클러스터로 묶어서 데이터의 밀도를 높입니다. 이를 통해 데이터의 차원을 감소시킬 수 있습니다.

샘플링: 데이터의 양을 줄이는 것으로, 더 적은 양의 데이터를 사용하여 분석합니다. 이를 통해 분석 시간을 단축시키며, 분석 결과를 빠르게 도출할 수 있습니다.

이러한 방법들을 활용하여 빅데이터에서 발생하는 차원의 저주를 해결할 수 있습니다.

https://www.youtube.com/watch?v=EXHR2-hECRM
방화.. 다중 채무자 청년층 평균 1억 1천만원.. 금강원 지하 용역직원 사망 한달간 침묵이유..기업 대출도 막혔다,.,이렇게 진행된다.

#부동산 #금리 #한국은행 #가계부채 #이자 #거품 #아파트 #경매 #매매 #영끌
우리 은행 (대동포럼) 박 홍기 후원계좌 1005 - 203 - 205878 대동포럼 소액 후원을 환영하며 10만원 이상은 정중하게 사절 합니다.


부동산 시장 정상화 법안 국회 입법 아이디어 게시판
https://cafe.daum.net/dobongbak/OHiH








땅 투자 100계명 출간
http://www.yes24.com/Product/Goods/102502674?OzSrank=1 예스24

디레버리징 2021~2024 수도권 파산과 경매의 시대에 관하여
http://www.yes24.com/Product/Goods/88389989?OzSrank=1
디레버리징』박홍기(금융정책과 아파트 투자) (1)~(2)편까지 한번에 듣기 중간광고없음

https://www.youtube.com/watch?v=CAww6fwk2Uot=4741s

리밸런싱 2019년 이후 경제 충격 현황에 관하여 [ 양장 ]
http://www.yes24.com/Product/Goods/67370014?OzSrank=2

바젤3 모멘트
구매: http://www.yes24.com/Product/Goods/91872623?OzSrank=1

대동포럼 도시경제 연구원
https://cafe.daum.net/dobongbak

카톡방: https://open.kakao.com/o/gxISRHtb
참여코드: 1L4UPc

카톡방 2: https://open.kakao.com/o/gyAMp8fd
참여 코드: X7G3


20개월간 부동산실거래 취소 19만건 육박…"투기수요 '집값조작' 악용

https://news.naver.com/main/read.naver?mode=LSDmid=shmsid1=101oid=421aid=0005656032





부동산 시장질서 확립을 위한 중점 대응전략 한국형사정책연구원

https://www.nrc.re.kr/board.es?mid=a10301000000bid=0008act=viewlist_no=0otp_id=OTP_0000000000007457
발간년도2021년
페이지수719

https://www.youtube.com/watch?v=LhJitkZ_Yvw
지난주 리포트 단어정리
* 아람코: “중국 수요가 정말 강하다. 하반기 유가 100달러 예상한다”

=========================

~ 사우디 국영 석유업체인 아람코의 아민 나세르 CEO는 지난 주말 블룸버그통신과의 인터뷰에서 "중국의 수요가 매우 강하다"며 올 하반기 국제유가가 100달러에 이를 것이라고 전망했다

https://www.getnews.co.kr/news/articleView.html?idxno=619006
Forwarded from iM전략 김준영
[DS 경제 김준영] 준클리 03/06(월)

연체율 걱정은 덜어도 된다

■ 금리 인상 리스크: 연체율 상승
- 20~30대 신용카드 연체율이 빠르게 상승 중
- 높은 인플레이션 및 금리 상승에 따른 연체율 상승
- 코로나 지원 등의 효과 사라지며 코로나 이전으로 돌아가는 중

■ 걱정은 하지 않아도 된다
- 하지만 전체 대출 중 신용카드 대출이 차지하는 비중은 적음
- 전체 대출 대비 연체되고 있는 대출의 비중은 코로나 이전보다 낮음

보고서 링크 : https://bit.ly/41MjHzq

☆DS 경제 텔레 채널☆
https://t.me/crazyecon

☆DS 리서치센터 텔레 채널☆
https://t.me/DSInvResearch
2023년 3월 6일 매크로 데일리

세줄요약

(1) 중국 정부가 올해 성장률 목표를 기대에 못 미치는 5%로 제시했습니다.

(2) 3월 25bp 언급으로 10년 국채금리가 4%를 밑돌며 미 증시가 올랐습니다.

(3) 올해 IT 섹터 영업이익 컨센서스가 20조원을 밑돌았습니다.
에스엠: 카카오 adios!

(코스닥)에스엠 - 기타주요경영사항 (유상증자 및 전환사채 발행에 대한 계약 해제)
http://dart.fss.or.kr/api/link.jsp?rcpNo=20230306900055

2023.03.06
Forwarded from 인포맥스
샌프란 연은 총재 "금리 오랜기간 높게 유지해야"
https://ift.tt/hZrY23P
Forwarded from 재야의 고수들
BlackPink 지수 솔로 데뷔
2023-03-31 날짜 확정

#엔터 #하이브 #SM #YG #JYP #음반판매
주52시간제 대대적 개편…주69시간 일하고 장기휴가 가능해진다
https://n.news.naver.com/mnews/article/001/0013793805?rc=N&ntype=RANKING
──────
내가 보기에 아직 짧다는 생각이 든다. 좀 더 할 수 있을 것 같은데. 이스라엘은 텐트시위하고 프랑스는 전국총파업하고 그럴 사안인데 조용하잖아? 그 말은 120시간 해도 괜찮다는 것이지. 정책이라는 게 눈치보고 간 보면서 하는거라. 당사자들이 침묵하면 뭐 어쩔 방도가 없지. "에이~ 내 대신 누가 투쟁해주겠찌~" 노동시장의 공급자들이 이런 쓰레기 마인드로 일관해서 조용한가. 야 니들 IMF 떄 노동권 포기하고 금 갖다 바치고 공적자금도 투입해놓고 권리 위에서 자는구나.
오늘 보고서들 키워드
리포트 공감능력📂
오늘 보고서들 키워드
파이썬에서 워드클라우드 만드는 코드입니다.
투자에 참고하세요.

import requests
from bs4 import BeautifulSoup
from collections import Counter
from wordcloud import WordCloud
import matplotlib.pyplot as plt

# 크롤링할 사이트 URL
url = '원하는 주소링크'

# 사이트 HTML 소스 코드 가져오기
res = requests.get(url)
html = res.text

# BeautifulSoup 객체 생성
soup = BeautifulSoup(html, 'html.parser')

# dd 태그에 해당되는 부분 추출하기
dd_tags = soup.select('원흔 태그로 추출')

# 텍스트 추출하기
text = ''
for dd in dd_tags:
text += dd.text.strip() + ' '

# stopwords 설정하기(필터링 단어설정)
stopwords = ['거를단어','거를단어어어어','거를단어']

# stopwords 제외하고 텍스트 단어 빈도수 카운트하기
words = [word for word in text.split() if word not in stopwords]
count = Counter(words)

# WordCloud 생성하기
wc = WordCloud(width=1200, height=1200, background_color='black', max_words=60, font_path='원하는글꼴')
wc.generate_from_frequencies(count)

# 워드클라우드 시각화하기
plt.imshow(wc, interpolation='bilinear')
plt.axis('off')
plt.show()

# 워드클라우드 저장하기
wc.to_file('wordcloud.png')
')
👍1