본문 바로가기
728x90

생각은축복이다9

pandas 에서 테이블을 합치는 두 가지 방법: concat과 merge python에서 여러 테이블을 처리할 때 서로 다른 테이블을 붙이거나 관계형으로 이어서 활용할 경우가 왕왕 있습니다.이 때 concat, merge를 주로 활용하는데 저처럼 마구잡이로 배운사람은 헷갈리는 경우가 많아서 도움이 되었으면 하는 마음에 주요 기능을 정리합니다. concat은 좀 더 붙이는 기능 위주고 merge는 관계형 데이터, sql을 하는 것과 비슷하다고 생각하면 헷갈릴 일이 적을듯합니다. 선요약 🔥 concat() vs merge() 비교 정리비교 항목concatmerge주요 기능여러 DataFrame을 단순히 이어붙임공통된 컬럼(키)을 기준으로 병합유사한 SQL 연산UNION (행 추가)JOIN (INNER, OUTER, LEFT, RIGHT)병합 기준컬럼이 같아야 정렬됨 (없으면 N.. 2025. 3. 9.
knime에 anaconda 를 활용해 python script 활용하기 1. KNIME Python Integration 설치:KNIME Analytics Platform에서 Python 스크립트를 실행하려면 KNIME Python Integration을 설치해야 합니다. 이는 KNIME의 확장 기능으로, KNIME Analytics Platform의 메뉴에서 File > "Install Extensions"를 선택하고, KNIME Python Integration을 찾아 설치할 수 있습니다. ​   2. Anaconda 설치 및 환경 설정:Anaconda 또는 Miniconda를 설치하여 Python 환경을 관리할 수 있습니다. Anaconda는 다양한 패키지를 포함한 배포판이며, Miniconda는 최소한의 설치로 시작하여 필요한 패키지만 추가할 수 있는 경량 버전입니다.. 2025. 3. 7.
다크 패턴(Dark Patterns)이란 무엇인가? 네이버 쇼핑을 예로 살펴보자 다크 패턴(Dark Patterns)란?다크 패턴은 사용자의 합리적인 결정을 방해하도록 설계된 UI/UX 디자인을 의미한다. 이는 사용자가 특정 행동(예: 구독 유지, 추가 구매 등)을 하도록 유도하거나, 불필요한 정보를 숨기는 방식으로 이루어진다.온라인 플랫폼이 활성화되면서, 플랫폼 운영자들은 사용자 참여를 극대화하고 매출을 높이기 위해 다크 패턴을 활용하는 경우가 많아지고 있다. 네이버 쇼핑 같은 대형 플랫폼에서도 이러한 다크 패턴이 존재할 수 있다.다크 패턴의 유형과 네이버 쇼핑에서의 사례대표적인 다크 패턴 유형과 네이버 쇼핑에서 발생할 수 있는 예시를 살펴보자.1. Nagging (끈질김)사용자가 원하지 않는 상호작용을 반복해서 유도하는 방식이다.📌 예시:네이버 쇼핑에서 특정 상품을 검색했을 때.. 2025. 3. 5.
쉽게 이해하는 대출 관련 지표: DSR, DTI, LTV 대출을 받을 때 은행이나 금융기관이 가장 중요하게 보는 지표는 DSR, DTI, LTV입니다. 이 개념들이 어렵게 느껴질 수 있지만, 간단한 예시를 통해 쉽게 설명해드릴게요.  1. DSR (총부채원리금상환비율) - "내가 버는 돈으로 대출을 얼마나 갚을 수 있을까?"DSR 개념DSR은 내 연 소득 대비 내가 갚아야 하는 모든 대출의 원금과 이자의 비율을 의미합니다.쉽게 말해, 내가 1년에 버는 돈 중에서 대출을 갚는 데 얼마나 쓰는지를 나타냅니다.DSR 계산식DSR (%) = (모든 대출의 연간 원리금 상환액 ÷ 연소득) × 100예시내가 연봉 5,000만 원을 받는 직장인이라고 가정해볼게요.대출로 인해 1년에 갚아야 할 원금과 이자가 2,000만 원이라면?DSR = (2,000만 원 ÷ 5,000만 .. 2025. 3. 1.
모델의 정확도만 믿어도 될까요?— 신뢰성을 결정하는 Calibration의 중요성 머신러닝 모델을 평가할 때 가장 먼저 떠오르는 지표는 무엇일까요? 아마 대부분 "정확도(Accuracy)"라고 대답할 것입니다. 맞춘 개수의 비율이 높으면 좋은 모델이라고 생각하기 쉽습니다. 하지만, 단순히 맞춘 비율이 높은 것이 과연 모델을 신뢰할 수 있다는 의미일까요?정확도가 높은데도 신뢰할 수 없는 모델?예를 들어, 당신이 자율주행차를 타고 있다고 가정해봅시다. 도로에 보행자가 있는지 없는지를 판단하는 AI 모델이 95%의 정확도를 가지고 있다고 합니다. 얼핏 보면 꽤 높은 정확도처럼 보이죠. 하지만 이 모델이 "보행자가 없다"고 예측할 때 실제로 보행자가 있을 확률이 20%나 된다면 어떨까요? 이런 상황에서 우리는 이 모델을 과연 믿을 수 있을까요?정확도가 높아도 예측값이 신뢰할 수 없는 경우가 .. 2025. 2. 27.
SQL 문자열 검색 & 편집 꿀팁 PostgreSQL에서 문자열을 검색하거나 편집하는 방법을 잘 활용하면 데이터를 보다 효율적으로 다룰 수 있습니다. 이번 글에서는 실무에서 자주 사용하는 SQL 문자열 처리 꿀팁을 소개해 드릴게요! 💡 🔎 1. 특정 문자열 포함된 데이터 찾기1) `LIKE` 활용 (가장 기본적인 방법) SELECT * FROM your_tableWHERE a LIKE '%당근%';✅ `%당근%` → 앞뒤로 `%`를 붙이면 문자열 어디에든 포함된 데이터를 찾을 수 있어요! (예를 들어, '당근' 대신 '고구마'를 넣으면 '고구마'가 포함된 데이터를 찾을 수 있습니다.)### 2) `POSITION` 활용 (위치 찾기)SELECT * FROM your_tableWHERE POSITION('당근' IN a) > 0;✅ `.. 2025. 2. 14.
728x90