๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

self-study7

์‹ ์šฉ์ •๋ณด ์ œ์žฌ ๊ฒฐ๊ณผ ๋ถ„์„ ์ž๋™ํ™” ์ˆ˜์ง‘ :: ์›น ํฌ๋กค๋ง, PDF ๋‹ค์šด๋กœ๋“œ, OCR ํ™œ์šฉ ๐Ÿ“š ํ”„๋กœ์ ํŠธ ๊ฐœ์š”- (ํ•™์Šต ๋ชฉํ‘œ) ์ด๋ฒˆ ํ”„๋กœ์ ํŠธ์˜ ์ฃผ์š” ๋ชฉํ‘œ๋Š” ์›น ํฌ๋กค๋ง๊ณผ PDF ๋ฐ์ดํ„ฐ ์ถ”์ถœ์„ ํ†ตํ•ด ๊ธˆ์œต๊ฐ๋…์›์—์„œ ์ œ๊ณตํ•˜๋Š” ๊ฒ€์‚ฌ๊ฒฐ๊ณผ ์ œ์žฌ ์ •๋ณด๋ฅผ ์ž๋™์œผ๋กœ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ , OCR์„ ํ™œ์šฉํ•˜์—ฌ ํ…์ŠคํŠธ๋ฅผ ์ถ”์ถœํ•˜๋Š” ๊ธฐ์ˆ  ํ•™์Šต- (๋ถ„์„ ๊ณผ์ •) ๊ธˆ์œต๊ฐ๋…์› ์›น์‚ฌ์ดํŠธ์—์„œ "์‹ ์šฉ์ •๋ณด"์— ๊ด€ํ•œ ์ œ์žฌ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•˜์—ฌ, ๊ด€๋ จ๋œ PDF ํŒŒ์ผ์„ ๋‹ค์šด๋กœ๋“œํ•œ ํ›„, ํ•ด๋‹น ํŒŒ์ผ์—์„œ ํ•„์š”ํ•œ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•˜์—ฌ ์—‘์…€ ํŒŒ์ผ๋กœ ์ €์žฅ [ ์›น ํฌ๋กค๋ง → PDF ์ฒ˜๋ฆฌ → OCR ํ™œ์šฉ →  ์—‘์…€ ์ €์žฅ]  ๐Ÿ’ป ํ•™์Šต ๋‚ด์šฉ1. ์„ค์น˜ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๊ธฐ๋Šฅ(์ƒ์„ธ ์„ค๋ช…)์„ค์น˜ ์ฝ”๋“œ์„ค์น˜ ํ™•์ธ ์ฝ”๋“œrequestsHTTP ์š”์ฒญ์„ ๋ณด๋‚ด๊ณ  ์‘๋‹ต์„ ์ฒ˜๋ฆฌํ•˜๋Š” ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ. ์ฃผ๋กœ ์›น์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค์šด๋กœ๋“œ ๋ฐ›์„ ๋•Œ ์‚ฌ์šฉpip install requestsimport request.. 2025. 3. 13.
[์ฝ”๋“œ์ž‡ : ๊ธฐ์ดˆ ํ†ต๊ณ„์™€ ๋ฐ์ดํ„ฐ ์‹œ๊ฐํ™”] ํ†ต๊ณ„์™€ ๋ฐ์ดํ„ฐ ์‹œ๊ฐํ™” ์™„๋ฒฝ ๊ฐ€์ด๋“œ : ํ†ต๊ณ„ ๊ธฐ๋ณธ ์ƒ์‹ | seaborn | seaborn์œผ๋กœ ๊ทธ๋ž˜ํ”„ ์ปค์Šคํ„ฐ๋งˆ์ด์ง• ํ†ต๊ณ„๋ž€?- ์–ด๋–ค ์ƒํ™ฉ์„ ์‰ฝ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋„๋ก ์ˆซ์ž๋กœ ์ •๋ฆฌํ•˜๋Š” ๊ฒƒ- ๊ธฐ์ˆ ํ†ต๊ณ„(descriptive statisics)์™€ ์ถ”๋ก ํ†ต๊ณ„(Inferential statistics)๋กœ ๋‚˜๋‰จ  โœ”๏ธ ๊ธฐ์ˆ ํ†ต๊ณ„ : ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ์…‹์„ ์ž˜ ์š”์•ฝํ•˜๊ณ  ํ•ต์‹ฌ์ ์ธ ํŠน์ง•์„ ํŒŒ์•…ํ•˜๋Š” ๋ถ„์•ผ  โœ”๏ธ ์ถ”๋ก ํ†ต๊ณ„ : ํ‘œ๋ณธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ชจ์ง‘๋‹จ์ด ์–ด๋–จ ๊ฒƒ์ธ๊ฐ€์— ๋Œ€ํ•œ ์ถ”๋ก ์„ ํ•˜๋Š” ๋ถ„์•ผ- seaborn ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์“ฐ๋ฉด matplotlib ๋ณด๋‹ค ๊ทผ์‚ฌํ•œ ๊ทธ๋ž˜ํ”„๋ฅผ ๊ทธ๋ฆด ์ˆ˜ ์žˆ๊ฒŒ ๋จ  ๋ฐ•์Šค ํ”Œ๋กฏ๊ณผ ์ด์ƒ์ 1. IQR๊ณผ ์ด์ƒ์ ์˜ ๊ฐœ๋… - Interquartile Range(IQR) : ๋ฐ•์Šค์˜ ๊ฐ€์žฅ ์•„๋ž˜ ๋ถ€๋ถ„์€ 25%์ธ 1์‚ฌ๋ถ„์œ„์ˆ˜์ด๊ณ  ์œ„ ๋ถ€๋ถ„์€ 75%์ธ 3์‚ฌ๋ถ„์œ„์ˆ˜๋กœ, ๋‘˜ ์‚ฌ์ด์˜ ๊ฑฐ๋ฆฌ๋ฅผ ์˜๋ฏธ- ์ด์ƒ์ (Outlier) : ์œ ๋… ํŠ€๋Š” ๊ฐ’๋“ค- ์ด์ƒ์ ์˜ ์ •์˜ : Q1 .. 2025. 1. 25.
[์ฝ”๋“œ์ž‡ : ๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธ์Šค Toolkit] ํŒŒ์ด์ฌ ๋ฐ์ดํ„ฐ ๋ถ„์„ ์ฒซ๊ฑธ์Œ - Numpy, Pandas, Matplotlib๋กœ ์‰ฝ๊ณ  ๊ฐ•๋ ฅํ•˜๊ฒŒ ๋ฐฐ์šฐ๊ธฐ Numpy1. Numpy๋ž€?- Numerical Python : ์ˆ˜์น˜์ ์ธ ์—ฐ์‚ฐ์— ์ตœ์ ํ™”๋œ ํŒŒ์ด์ฌ ๋„๊ตฌ- Numpy Array(๋„˜ํŒŒ์ด ๋ฐฐ์—ด) : Python List์™€ ์œ ์‚ฌํ•œ ์ž๋ฃŒํ˜•์ด์ง€๋งŒ ๋งŽ์€ ์–‘์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ„๊ฒฐํ•œ ์ฝ”๋“œ๋กœ ๊ตฌํ˜„  2. Numpy์™€ Array[ ์ฝ”๋“œ ]import numpy as npprint(np.zeros(5))print(np.arange(10))print(np.arange(2,10)) # ์‹œ์ž‘์ , ๋๋‚˜๋Š” ์ print(np.arange(4, 17, 3)) # ์‹œ์ž‘์ , ๋๋‚˜๋Š” ์ , ๊ฐ„๊ฒฉ[ ์ถœ๋ ฅ๋ฌผ ][0. 0. 0. 0. 0.][0 1 2 3 4 5 6 7 8 9][2 3 4 5 6 7 8 9][ 4 7 10 13 16]  3. ์ธ๋ฑ์‹ฑ๊ณผ ์Šฌ๋ผ์ด์‹ฑ : 1์ฐจ์› array[ ์ฝ”๋“œ ]impor.. 2025. 1. 11.
[์ฝ”๋“œ์ž‡ : ํ”„๋กœ๊ทธ๋ž˜๋ฐ๊ณผ ๋ฐ์ดํ„ฐ in Python] ํŒŒ์ด์ฌ ์ดˆ๋ณด ํƒˆ์ถœ! ๋ฆฌ์ŠคํŠธ์™€ ๋”•์…”๋„ˆ๋ฆฌ ํ™œ์šฉ๋ฒ•๋ถ€ํ„ฐ ํ…์ŠคํŠธ ํŒŒ์ผ ์ฝ๊ธฐ·์“ฐ๊ธฐ ๋ฐฉ๋ฒ• ๋ฆฌ์ŠคํŠธ1. ๋ฆฌ์ŠคํŠธ์™€ ๋ฆฌ์ŠคํŠธ ์Šฌ๋ผ์ด์‹ฑ[ ์ฝ”๋“œ ]# ๋ฆฌ์ŠคํŠธ(list)numbers = [2, 3, 5, 7, 11, 13]names = ["์œค์ˆ˜", "ํ˜œ๋ฆฐ", "ํƒœํ˜ธ", "์˜ํ›ˆ"]# ์ธ๋ฑ์‹ฑ(indexing)print(numbers[1] + numbers[3])# ๋ฆฌ์ŠคํŠธ ์Šฌ๋ผ์ด์‹ฑ(list slicing)print(numbers[0:4])[ ์ถœ๋ ฅ๋ฌผ ]10[2, 3, 5, 7]  2. ๋ฆฌ์ŠคํŠธ ํ•จ์ˆ˜- len(๋ฆฌ์ŠคํŠธ๋ช…) : ๋ฆฌ์ŠคํŠธ์˜ ๊ธธ์ด๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ํ•จ์ˆ˜- ๋ฆฌ์ŠคํŠธ๋ช….append(๊ฐ’) : ๋ฆฌ์ŠคํŠธ์— ๊ฐ’์„ ์ž…๋ ฅํ•˜๋Š” ํ•จ์ˆ˜- del ๋ฆฌ์ŠคํŠธ๋ช…[๋ฒˆํ˜ธ] : ๋ฆฌ์ŠคํŠธ๋ช…์˜ [๋ฒˆํ˜ธ]๋ฒˆ์งธ ๊ฐ’์„ ์‚ญ์ œํ•˜๋Š” ํ•จ์ˆ˜- ๋ฆฌ์ŠคํŠธ๋ช….insert(๋ฒˆํ˜ธ, ๊ฐ’) : ๋ฒˆํ˜ธ๋ฒˆ์งธ์— ๊ฐ’์„ ์ž…๋ ฅํ•˜๋Š” ํ•จ์ˆ˜  3. ๋ฆฌ์ŠคํŠธ ์ •๋ ฌ[ ์ฝ”๋“œ ]numbers = [19, 13, 2.. 2025. 1. 10.
[์ฝ”๋“œ์ž‡ : ํ”„๋กœ๊ทธ๋ž˜๋ฐ ํ•ต์‹ฌ ๊ฐœ๋… in Python] Python ๊ธฐ์ดˆ ๋ฌธ๋ฒ• ์™„๋ฒฝ ์ •๋ฆฌ - ์ž๋ฃŒํ˜• | ๋ฌธ์ž์—ด | ์ œ์–ด๋ฌธ | ์Šคํƒ€์ผ ๊ฐ€์ด๋“œ(PEP8) ์ž๋ฃŒํ˜•1. ์ˆซ์žํ˜•[ ์ฝ”๋“œ ]print(7 % 3) # ๋‚˜๋จธ์ง€print(2 ** 3) # ๊ฑฐ๋“ญ์ œ๊ณฑprint(7 // 2) # ๋ฒ„๋ฆผ ๋‚˜๋ˆ—์…ˆprint(round(3.141592, 2) # ๋ฐ˜์˜ฌ๋ฆผ(round) [ ๊ฒฐ๊ณผ๋ฌผ ] 1833.14  2. Type ํ•จ์ˆ˜[ ์ฝ”๋“œ ]print(type(3))[ ๊ฒฐ๊ณผ๋ฌผ ]  3. ๋ฌธ์ž์—ด๊ณผ ๋ฌธ์ž์—ด ์—ฐ๊ฒฐ(String Concatenation)(1) ๊ธฐ๋ณธ ๋ฌธ์ž์—ด ์—ฐ๊ฒฐ ๋ฐฉ๋ฒ•[ ์ฝ”๋“œ ]subject = 'I'emotion = 'excited'print(subject + '\'m ' + emotion + ' to learn Python')- ๋ฌธ์ž์—ด์— '๋‚˜ "๋ฅผ ์“ฐ๊ณ  ์‹ถ์€ ๊ฒฝ์šฐ ์•ž์— \๋ฅผ ์จ์ค˜์•ผ ์˜ค๋ฅ˜๊ฐ€ ๋‚˜์ง€ ์•Š์Œ  (2) format์„ ์ด์šฉํ•œ ๋ฌธ์ž์—ด ํฌ๋งคํŒ…year = 2019.. 2025. 1. 10.
[์ฝ”๋“œ์ž‡ : ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์‹œ์ž‘ํ•˜๊ธฐ in Python] ํŒŒ์ด์ฌ ๊ธฐ์ดˆ ๊ฐœ๋… ํ•™์Šตํ•˜๊ธฐ - ์ž๋ฃŒํ˜• | ์ถ”์ƒํ™” | ํ•จ์ˆ˜ | ํŒŒ๋ผ๋ฏธํ„ฐ ์ž๋ฃŒํ˜• ๊ฐœ์š”- ์ •์ˆ˜(Integer)- ์†Œ์ˆ˜(Floating Point)- ๋ฌธ์ž์—ด(String)- ๋ถˆ๋ฆฐ(Boolean) : True / False  ์ถ”์ƒํ™” ๊ฐœ์š”- ์ถ”์ƒํ™”(Abstraction)๋ž€ ? ๋ณต์žกํ•œ ์ž๋ฃŒ, ๋ชจ๋“ˆ, ์‹œ์Šคํ…œ ๋“ฑ์œผ๋กœ๋ถ€ํ„ฐ ํ•ต์‹ฌ์ ์ธ ๊ฐœ๋… ๋˜๋Š” ๊ธฐ๋Šฅ์„ ๊ฐ„์ถ”๋ ค ๋‚ด๋Š” ๊ฒƒ- ์ถ”์ƒํ™”์˜ 3๋‹จ๊ณ„ : ๋ณ€์ˆ˜(Variable), ํ•จ์ˆ˜(function), ๊ฐ์ฒด(Object)  ํ•จ์ˆ˜(Function)- ํ•จ์ˆ˜๋ฅผ ์ง์ ‘ ์ •์˜ํ•  ์ˆ˜ ์žˆ์Œ[ ์ฝ”๋“œ ] def hello() : # ํ•จ์ˆ˜์˜ ํ—ค๋” print("Hello!") print("Welcome to Codeit!")hello() # hello ํ•จ์ˆ˜ ํ˜ธ์ถœ  ํŒŒ๋ผ๋ฏธํ„ฐ- ํŒŒ๋ผ๋ฏธํ„ฐ๋ž€ ํ•จ์ˆ˜์— ๋„˜๊ฒจ ์ฃผ๋Š” ๊ฐ’[ ์ฝ”๋“œ ]def hello(name) : # ์—ฌ๊ธฐ์„œ name์ด ํŒŒ.. 2025. 1. 9.