일정 시간대 생성 & 존재하지 않는 시간 확인:: pd.date_range
import pandas as pd
pd.date_range(
start = None, # str/datetime
end = None, # str/datetime
periods = None, # int
freq = None, # str/Dateoffset
tz = None, # str
normalizae = False, # True/False
name = None, # str
closed = None # left,right
)
1. 일정 시간대 생성
- start_day : '2010-01-01'
- end_day : '2015-3-14'
start_day = '2010-01-01'
end_day = '2015-03-14'
pd.date_range(start = start_day, end = end_day)
DatetimeIndex(['2010-01-01', '2010-01-02', '2010-01-03', '2010-01-04',
'2010-01-05', '2010-01-06', '2010-01-07', '2010-01-08',
'2010-01-09', '2010-01-10',
...
'2015-03-05', '2015-03-06', '2015-03-07', '2015-03-08',
'2015-03-09', '2015-03-10', '2015-03-11', '2015-03-12',
'2015-03-13', '2015-03-14'],
dtype='datetime64[ns]', length=1899, freq='D')
2. DF에 존재하지 않는 시간 확인
# df date_time의 전체 시간 범위 생성
full_range = pd.date_range(start = df['date_time'].min(), end = df['date_time'].max(), freq = 'H')
# df date_time에 존재하지 않는 시간
missing_times = full_range[~ full_range.isin(df['date_time'])]
missing_times