import os
import sys
import mxnet as mx
import random
import argparse
import cv2
import time
import traceback
from easydict import EasyDict as edict
sys.path.append(os.path.join(os.path.dirname(__file__), '..', 'common'))
import face_align

try:
    import multiprocessing
except ImportError:
    multiprocessing = None


def parse_lst_line(line):
    vec = line.strip().split("\t")
    assert len(vec) >= 3
    aligned = int(vec[0])
    image_path = vec[1]
    label = int(vec[2])
    bbox = None
    landmark = None
    #print(vec)
    if len(vec) > 3:
        bbox = np.zeros((4, ), dtype=np.int32)
        for i in xrange(3, 7):
            bbox[i - 3] = int(vec[i])
        landmark = None
        if len(vec) > 7:
            _l = []
            for i in xrange(7, 17):
                _l.append(float(vec[i]))
            landmark = np.array(_l).reshape((2, 5)).T
    #print(aligned)
    return image_path, label, bbox, landmark, aligned


def read_list(path_in):
    with open(path_in) as fin:
        identities = []
        last = [-1, -1]
        _id = 1
        while True:
            line = fin.readline()
            if not line:
                break
            item = edict()
            item.flag = 0
            item.image_path, label, item.bbox, item.landmark, item.aligned = parse_lst_line(
                line)
            if not item.aligned and item.landmark is None:
                #print('ignore line', line)
                continue
            item.id = _id
            item.label = [label, item.aligned]
            yield item
            if label != last[0]:
                if last[1] >= 0:
                    identities.append((last[1], _id))
                last[0] = label
                last[1] = _id
            _id += 1
        identities.append((last[1], _id))
        item = edict()
        item.flag = 2
        item.id = 0
        item.label = [float(_id), float(_id + len(identities))]
        yield item
        for identity in identities:
            item = edict()
            item.flag = 2
            item.id = _id
            _id += 1
            item.label = [float(identity[0]), float(identity[1])]
            yield item


def image_encode(args, i, item, q_out):
    oitem = [item.id]
    #print('flag', item.flag)
    if item.flag == 0:
        fullpath = item.image_path
        header = mx.recordio.IRHeader(item.flag, item.label, item.id, 0)
        #print('write', item.flag, item.id, item.label)
        if item.aligned:
            with open(fullpath, 'rb') as fin:
                img = fin.read()
            s = mx.recordio.pack(header, img)
            q_out.put((i, s, oitem))
        else:
            img = cv2.imread(fullpath, args.color)
            assert item.landmark is not None
            img = face_align.norm_crop(img, item.landmark)
            s = mx.recordio.pack_img(header,
                                     img,
                                     quality=args.quality,
                                     img_fmt=args.encoding)
            q_out.put((i, s, oitem))
    else:
        header = mx.recordio.IRHeader(item.flag, item.label, item.id, 0)
        #print('write', item.flag, item.id, item.label)
        s = mx.recordio.pack(header, '')
        q_out.put((i, s, oitem))


def read_worker(args, q_in, q_out):
    while True:
        deq = q_in.get()
        if deq is None:
            break
        i, item = deq
        image_encode(args, i, item, q_out)


def write_worker(q_out, fname, working_dir):
    pre_time = time.time()
    count = 0
    fname = os.path.basename(fname)
    fname_rec = os.path.splitext(fname)[0] + '.rec'
    fname_idx = os.path.splitext(fname)[0] + '.idx'
    record = mx.recordio.MXIndexedRecordIO(
        os.path.join(working_dir, fname_idx),
        os.path.join(working_dir, fname_rec), 'w')
    buf = {}
    more = True
    while more:
        deq = q_out.get()
        if deq is not None:
            i, s, item = deq
            buf[i] = (s, item)
        else:
            more = False
        while count in buf:
            s, item = buf[count]
            del buf[count]
            if s is not None:
                #print('write idx', item[0])
                record.write_idx(item[0], s)

            if count % 1000 == 0:
                cur_time = time.time()
                print('time:', cur_time - pre_time, ' count:', count)
                pre_time = cur_time
            count += 1


def parse_args():
    parser = argparse.ArgumentParser(
        formatter_class=argparse.ArgumentDefaultsHelpFormatter,
        description='Create an image list or \
        make a record database by reading from an image list')
    parser.add_argument('prefix',
                        help='prefix of input/output lst and rec files.')
    #parser.add_argument('root', help='path to folder containing images.')

    cgroup = parser.add_argument_group('Options for creating image lists')
    cgroup.add_argument(
        '--list',
        type=bool,
        default=False,
        help=
        'If this is set im2rec will create image list(s) by traversing root folder\
        and output to <prefix>.lst.\
        Otherwise im2rec will read <prefix>.lst and create a database at <prefix>.rec'
    )
    cgroup.add_argument('--exts',
                        nargs='+',
                        default=['.jpeg', '.jpg'],
                        help='list of acceptable image extensions.')
    cgroup.add_argument('--chunks',
                        type=int,
                        default=1,
                        help='number of chunks.')
    cgroup.add_argument('--train-ratio',
                        type=float,
                        default=1.0,
                        help='Ratio of images to use for training.')
    cgroup.add_argument('--test-ratio',
                        type=float,
                        default=0,
                        help='Ratio of images to use for testing.')
    cgroup.add_argument(
        '--recursive',
        type=bool,
        default=False,
        help=
        'If true recursively walk through subdirs and assign an unique label\
        to images in each folder. Otherwise only include images in the root folder\
        and give them label 0.')
    cgroup.add_argument('--shuffle',
                        type=bool,
                        default=True,
                        help='If this is set as True, \
        im2rec will randomize the image order in <prefix>.lst')

    rgroup = parser.add_argument_group('Options for creating database')
    rgroup.add_argument(
        '--quality',
        type=int,
        default=95,
        help=
        'JPEG quality for encoding, 1-100; or PNG compression for encoding, 1-9'
    )
    rgroup.add_argument(
        '--num-thread',
        type=int,
        default=1,
        help=
        'number of thread to use for encoding. order of images will be different\
        from the input list if >1. the input list will be modified to match the\
        resulting order.')
    rgroup.add_argument('--color',
                        type=int,
                        default=1,
                        choices=[-1, 0, 1],
                        help='specify the color mode of the loaded image.\
        1: Loads a color image. Any transparency of image will be neglected. It is the default flag.\
        0: Loads image in grayscale mode.\
        -1:Loads image as such including alpha channel.')
    rgroup.add_argument('--encoding',
                        type=str,
                        default='.jpg',
                        choices=['.jpg', '.png'],
                        help='specify the encoding of the images.')
    rgroup.add_argument(
        '--pack-label',
        type=bool,
        default=False,
        help='Whether to also pack multi dimensional label in the record file')
    args = parser.parse_args()
    args.prefix = os.path.abspath(args.prefix)
    #args.root = os.path.abspath(args.root)
    return args


if __name__ == '__main__':
    args = parse_args()
    if args.list:
        pass
        #make_list(args)
    else:
        if os.path.isdir(args.prefix):
            working_dir = args.prefix
        else:
            working_dir = os.path.dirname(args.prefix)
        image_size = (112, 112)
        print('image_size', image_size)
        args.image_h = image_size[0]
        args.image_w = image_size[1]
        files = [
            os.path.join(working_dir, fname)
            for fname in os.listdir(working_dir)
            if os.path.isfile(os.path.join(working_dir, fname))
        ]
        count = 0
        for fname in files:
            if fname.startswith(args.prefix) and fname.endswith('.lst'):
                print('Creating .rec file from', fname, 'in', working_dir)
                count += 1
                image_list = read_list(fname)
                # -- write_record -- #
                if args.num_thread > 1 and multiprocessing is not None:
                    q_in = [
                        multiprocessing.Queue(1024)
                        for i in range(args.num_thread)
                    ]
                    q_out = multiprocessing.Queue(1024)
                    read_process = [multiprocessing.Process(target=read_worker, args=(args, q_in[i], q_out)) \
                                    for i in range(args.num_thread)]
                    for p in read_process:
                        p.start()
                    write_process = multiprocessing.Process(
                        target=write_worker, args=(q_out, fname, working_dir))
                    write_process.start()

                    for i, item in enumerate(image_list):
                        q_in[i % len(q_in)].put((i, item))
                    for q in q_in:
                        q.put(None)
                    for p in read_process:
                        p.join()

                    q_out.put(None)
                    write_process.join()
                else:
                    print(
                        'multiprocessing not available, fall back to single threaded encoding'
                    )
                    try:
                        import Queue as queue
                    except ImportError:
                        import queue
                    q_out = queue.Queue()
                    fname = os.path.basename(fname)
                    fname_rec = os.path.splitext(fname)[0] + '.rec'
                    fname_idx = os.path.splitext(fname)[0] + '.idx'
                    record = mx.recordio.MXIndexedRecordIO(
                        os.path.join(working_dir, fname_idx),
                        os.path.join(working_dir, fname_rec), 'w')
                    cnt = 0
                    pre_time = time.time()
                    for i, item in enumerate(image_list):
                        image_encode(args, i, item, q_out)
                        if q_out.empty():
                            continue
                        _, s, item = q_out.get()
                        #header, _ = mx.recordio.unpack(s)
                        #print('write header label', header.label)
                        record.write_idx(item[0], s)
                        if cnt % 1000 == 0:
                            cur_time = time.time()
                            print('time:', cur_time - pre_time, ' count:', cnt)
                            pre_time = cur_time
                        cnt += 1
        if not count:
            print('Did not find and list file with prefix %s' % args.prefix)